Skip to content

Dedup count

The deduplicated UMI counts are saved uniformly in {method}_dedup.txt.

The column name means the round of permutation, e.g. pn0 means the 1st round of permutation with respect to a certain sequencing condition, e.g. sequencing errors from 0.000001 to 0.1.

pn0 pn1 pn2 pn3 pn4 pn5 pn6 pn7 pn8 pn9
50  50  50  50  50  50  50  50  50  49
50  50  50  50  50  50  50  50  50  50
50  50  50  50  50  50  50  50  50  50
50  50  50  50  50  50  50  50  50  50
51  51  51  51  51  51  51  51  51  51
51  51  51  51  51  51  51  51  51  51
51  51  51  51  51  51  51  52  51  51
51  51  51  51  51  51  52  51  51  51
50  50  50  50  50  50  50  50  50  50
51  51  51  51  51  51  51  51  51  51
50  50  51  50  51  51  50  51  51  50
51  51  51  51  51  51  51  51  51  51
51  51  51  51  51  51  51  51  51  51

In set_cover_multi_len_split_by_mv_dedup.txt, each cell means in each condition (e.g. at sequencing error rate 0.001) how many times are needed for set covering UMIs, with each element separated by ; meaning how many steps are needed to merge UMIs each time.

pn0 pn1 pn2 pn3 pn4 pn5 pn6 pn7 pn8 pn9
1;1;1;1 1;1;1;1 1;1;1   1;1;1   1;1;1   1;1 1;1;1   1;1;1   1;1;1;1 1;1;1
1;1;1;1;1;1 1;1;1;1;1;1 1;1;1;1;1   2;1;1;1 2;1;1;1 1;1;1;1 1;1;1;1;1   1;1;1;1;1   1;1;1;1;1;1 1;1;1;1;1
2;1;1;1;1;1;1;1;1;1;1;1 2;1;1;1;1;1;1;1;1;1;1;1 2;1;1;1;1;1;1;1;1;1;1   2;2;1;1;1;1;1;1;1;1 2;2;1;1;1;1;1;1;1;1 2;1;1;1;1;1;1;1;1;1 2;1;1;1;1;1;1;1;1;1;1   
...
138;130;126;126;124;120;119;117;115;114;112;112;111;110;110;110;110;109;109;107;107;106;106;105;103;102;100;100;99;97;91;91;90;89;89;86;85;75;73;70;70;63;63;57;56;45;44;41;35;27;5;5;5;5;5;4;4;4;4;4;4;4;4;4;4;4;4;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;3;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;2;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1;1

Below shows how many unique UMIs are or are not solved by set cover. Their combination means the total count of unique UMIs after set cover deduplication.

pn0 pn1 pn2 pn3 pn4 pn5 pn6 pn7 pn8 pn9
4.0 4.0 3.0 3.0 3.0 2.0 3.0 3.0 4.0 3.0
6.0 6.0 5.0 4.0 4.0 4.0 5.0 5.0 6.0 5.0
12.0    12.0    11.0    10.0    10.0    10.0    11.0    10.0    12.0    11.0
16.0    16.0    14.0    14.0    13.0    14.0    15.0    14.0    16.0    15.0
20.0    19.0    18.0    18.0    17.0    18.0    19.0    18.0    20.0    19.0
32.0    31.0    31.0    31.0    30.0    31.0    31.0    31.0    33.0    32.0
40.0    39.0    40.0    40.0    39.0    39.0    39.0    39.0    39.0    40.0
48.0    48.0    48.0    48.0    48.0    48.0    48.0    48.0    48.0    48.0
49.0    49.0    49.0    49.0    49.0    49.0    49.0    49.0    49.0    49.0
50.0    50.0    50.0    50.0    50.0    50.0    50.0    50.0    50.0    50.0
50.0    50.0    50.0    50.0    50.0    50.0    50.0    50.0    50.0    50.0
50.0    50.0    50.0    50.0    50.0    50.0    50.0    50.0    50.0    50.0
50.0    50.0    50.0    50.0    50.0    50.0    50.0    50.0    50.0    50.0
52.0    51.0    52.0    51.0    51.0    51.0    52.0    53.0    50.0    51.0
64.0    63.0    60.0    64.0    60.0    62.0    57.0    61.0    55.0    62.0
91.0    95.0    97.0    97.0    88.0    104.0   88.0    76.0    91.0    87.0
155.0   154.0   144.0   146.0   161.0   143.0   168.0   156.0   154.0   149.0
519.0   544.0   571.0   558.0   522.0   551.0   539.0   533.0   555.0   557.0
pn0 pn1 pn2 pn3 pn4 pn5 pn6 pn7 pn8 pn9
46.0    46.0    47.0    47.0    47.0    48.0    47.0    47.0    46.0    47.0
44.0    44.0    45.0    46.0    46.0    46.0    45.0    45.0    44.0    45.0
38.0    38.0    39.0    40.0    40.0    40.0    39.0    40.0    38.0    39.0
34.0    34.0    36.0    36.0    37.0    36.0    35.0    36.0    34.0    35.0
30.0    31.0    32.0    32.0    33.0    32.0    31.0    32.0    30.0    31.0
18.0    19.0    19.0    19.0    20.0    19.0    19.0    19.0    17.0    18.0
10.0    11.0    10.0    10.0    11.0    11.0    11.0    11.0    11.0    10.0
2.0 2.0 2.0 2.0 2.0 2.0 2.0 2.0 2.0 2.0
1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
3.0 3.0 1.0 1.0 1.0 2.0 1.0 0.0 1.0 2.0
4.0 6.0 4.0 4.0 6.0 3.0 2.0 2.0 2.0 4.0
8.0 7.0 10.0    8.0 5.0 9.0 9.0 7.0 7.0 8.0
49.0    51.0    56.0    50.0    55.0    44.0    51.0    59.0    56.0    53.0
153.0   149.0   175.0   172.0   169.0   163.0   161.0   165.0   165.0   160.0
328.0   331.0   328.0   313.0   336.0   334.0   343.0   339.0   334.0   358.0
467.0   455.0   463.0   472.0   482.0   483.0   451.0   460.0   516.0   501.0
1002.0  975.0   918.0   933.0   960.0   933.0   995.0   969.0   964.0   919.0

Read UMI trajectory files

The UMI trajectories across PCR amplification cycles are represented to be in a Python multiple dimensional dictionary. From outer to inner, the keys stand for:

Permutation number sequencing condition :material-arrow-ri ght-thin: connected component UMI that are merging other UMIs tuple (1. origin (UMI identity before PCR amplification); 2. merged UMIs that have the same origin; 3. merged UMIs that originate differently.

{"0": {"1e-05": {"cc0": {}, "cc1": {}, "cc2": {}, "cc3": {}, "cc4": {}, "cc5": {}, "cc6": {}, "cc7": {}, "cc8": {}, "cc9": {}, "cc10": {}, "cc11": {}, "cc12": {}, "cc13": {}, "cc14": {}, "cc15": {}, "cc16": {}, "cc17": {}, "cc18": {}, "cc19": {}, "cc20": {}, "cc21": {}, "cc22": {}, "cc23": {}, "cc24": {}, "cc25": {}, "cc26": {}, "cc27": {}, "cc28": {}, "cc29": {}, "cc30": {}, "cc31": {}, "cc32": {}, "cc33": {}, "cc34": {}, "cc35": {}, "cc36": {}, "cc37": {}, "cc38": {}, "cc39": {}, "cc40": {}, "cc41": {}, "cc42": {}, "cc43": {}, "cc44": {}, "cc45": {}, "cc46": {}, "cc47": {}, "cc48": {}, "cc49": {}}, "2.5e-05": {"cc0": {}, "cc1": {}, "cc2": {}, "cc3": {}, "cc4": {}, "cc5": {}, "cc6": {}, "cc7": {}, "cc8": {}, "cc9": {}, "cc10": {}, "cc11": {}, "cc12": {}, "cc13": {}, "cc14": {}, "cc15": {}, "cc16": {}, "cc17": {}, "cc18": {}, "cc19": {}, "cc20": {}, "cc21": {}, "cc22": {}, "cc23": {}, "cc24": {}, "cc25": {}, "cc26": {"26": {"ori": 41, "same": [50, 26], "diff": []}}, "cc27": {}, "cc28": {}, "cc29": {}, "cc30": {}, "cc31": {}, "cc32": {}, "cc33": {}, "cc34": {}, "cc35": {}, "cc36": {}, "cc37": {}, "cc38": {}, "cc39": {}, "cc40": {}, "cc41": {}, "cc42": {}, "cc43": {}, "cc44": {}, "cc45": {}, "cc46": {}, "cc47": {}, "cc48": {}, "cc49": {}}, "5e-05": {"cc0": {}, "cc1": {}, "cc2": {}, "cc3": {}, "cc4": {}, "cc5": {}, "cc6": {}, "cc7": {}, "cc8": {}, "cc9": {}, "cc10": {}, "cc11": {}, "cc12": {}, "cc13": {}, "cc14": {}, "cc15": {}, "cc16": {}, "cc17": {}, "cc18": {}, "cc19": {}, "cc20": {}, "cc21": {}, "cc22": {}, "cc23": {}, "cc24": {}, "cc25": {"25": {"ori": 25, "same": [51, 25], "diff": []}},