Get the N most abundant clonotypes

top(.data, .n = 10)

Arguments

.data

The data to be processed. Can be data.frame, data.table, or a list of these objects.

Every object must have columns in the immunarch compatible format. immunarch_data_format

Competent users may provide advanced data representations: DBI database connections, Apache Spark DataFrame from copy_to or a list of these objects. They are supported with the same limitations as basic objects.

Note: each connection must represent a separate repertoire.

.n

Numeric. Number of the most abundant clonotypes to return.

Value

Data frame with the .n most abundant clonotypes only.

Examples

data(immdata) top(immdata$data)
#> $`A2-i129` #> # A tibble: 10 x 15 #> Clones Proportion CDR3.nt CDR3.aa V.name D.name J.name V.end D.start D.end #> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <int> <int> <int> #> 1 173 0.0204 TGCGCC… CASSQE… TRBV4… TRBD1 TRBJ2… 16 18 26 #> 2 163 0.0192 TGCGCC… CASSYR… TRBV4… TRBD1 TRBJ2… 11 13 18 #> 3 66 0.00776 TGTGCC… CATSTN… TRBV15 TRBD1 TRBJ2… 11 16 22 #> 4 54 0.00635 TGTGCC… CATSIG… TRBV15 TRBD2 TRBJ2… 11 19 25 #> 5 48 0.00565 TGTGCC… CASSPW… TRBV27 TRBD1 TRBJ1… 11 16 23 #> 6 48 0.00565 TGCGCC… CASQGD… TRBV4… TRBD1 TRBJ1… 8 13 19 #> 7 40 0.00471 TGCGCC… CASSQD… TRBV4… TRBD1 TRBJ2… 16 21 26 #> 8 31 0.00365 TGTGCC… CASSEE… TRBV2 TRBD1 TRBJ1… 15 17 20 #> 9 30 0.00353 TGCGCC… CASSQP… TRBV4… TRBD1 TRBJ2… 14 23 28 #> 10 28 0.00329 TGTGCC… CASSWV… TRBV6… TRBD1 TRBJ2… 12 20 25 #> # … with 5 more variables: J.start <int>, VJ.ins <dbl>, VD.ins <dbl>, #> # DJ.ins <dbl>, Sequence <lgl> #> #> $`A2-i131` #> # A tibble: 10 x 15 #> Clones Proportion CDR3.nt CDR3.aa V.name D.name J.name V.end D.start D.end #> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <int> <int> <int> #> 1 111 0.0131 TGCAGT… CSASRG… TRBV2… TRBD1 TRBJ2… 11 12 17 #> 2 93 0.0109 TGTGCC… CASSVA… TRBV9 TRBD1 TRBJ2… 15 21 23 #> 3 66 0.00776 TGTGCC… CASSRM… TRBV13 TRBD1 TRBJ2… 11 18 24 #> 4 59 0.00694 TGTGCC… CASSPT… TRBV6… TRBD2 TRBJ2… 10 14 19 #> 5 57 0.00671 TGCGCC… CASSLD… TRBV5… TRBD2 TRBJ1… 15 17 20 #> 6 47 0.00553 TGTGCC… CASRGL… TRBV6… TRBD2 TRBJ2… 10 11 16 #> 7 46 0.00541 TGCAGC… CSVTGV… TRBV2… TRBD1 TRBJ2… 8 9 13 #> 8 30 0.00353 TGTGCC… CASSYL… TRBV6… TRBD2 TRBJ1… 15 17 19 #> 9 29 0.00341 TGTGCC… CASSLA… TRBV5… TRBD1 TRBJ1… 15 21 26 #> 10 29 0.00341 TGTGCC… CASSYI… TRBV6… TRBD1 TRBJ1… 14 17 20 #> # … with 5 more variables: J.start <int>, VJ.ins <dbl>, VD.ins <dbl>, #> # DJ.ins <dbl>, Sequence <lgl> #> #> $`A2-i133` #> # A tibble: 11 x 15 #> Clones Proportion CDR3.nt CDR3.aa V.name D.name J.name V.end D.start D.end #> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <int> <int> <int> #> 1 333 0.0392 TGTGCC… CASSLY… TRBV1… TRBD2 TRBJ2… 11 18 29 #> 2 111 0.0131 TGTGCC… CASSLG… TRBV7… TRBD1 TRBJ1… 12 15 19 #> 3 102 0.012 TGTGCC… CASSPL… TRBV7… TRBD2 TRBJ2… 11 18 23 #> 4 81 0.00953 TGTGCC… CASSPF… TRBV7… TRBD2 TRBJ1… 11 16 20 #> 5 71 0.00835 TGTGCC… CASSQG… TRBV4… TRBD2 TRBJ2… 15 19 22 #> 6 53 0.00624 TGTGCC… CASSVT… TRBV9 TRBD1 TRBJ1… 13 14 18 #> 7 45 0.00529 TGTGCC… CASSLG… TRBV7… TRBD1 TRBJ1… 15 16 18 #> 8 38 0.00447 TGTGCC… CASSST… TRBV7… TRBD1 TRBJ1… 16 19 24 #> 9 38 0.00447 TGTGCC… CASREL… TRBV28 TRBD2 TRBJ2… 10 24 29 #> 10 21 0.00247 TGCAGC… CSVDEG… TRBV2… TRBD1 TRBJ2… 10 14 17 #> 11 21 0.00247 TGTGCC… CASSLS… TRBV7… TRBD2 TRBJ2… 15 19 21 #> # … with 5 more variables: J.start <int>, VJ.ins <dbl>, VD.ins <dbl>, #> # DJ.ins <dbl>, Sequence <lgl> #> #> $`A2-i132` #> # A tibble: 10 x 15 #> Clones Proportion CDR3.nt CDR3.aa V.name D.name J.name V.end D.start D.end #> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <int> <int> <int> #> 1 41 0.00482 TGTGCC… CASSFR… TRBV7… TRBD1 TRBJ2… 10 16 26 #> 2 23 0.00271 TGTGCC… CAIRKQ… TRBV1… TRBD1 TRBJ1… 10 15 19 #> 3 20 0.00235 TGCGCC… CASSTR… TRBV4… TRBD2 TRBJ2… 11 20 28 #> 4 20 0.00235 TGTGCC… CASSYL… TRBV6… TRBD1 TRBJ1… 14 18 27 #> 5 18 0.00212 TGTGCC… CASSYI… TRBV6… TRBD1 TRBJ1… 14 18 23 #> 6 18 0.00212 TGTGCC… CASSLL… TRBV28 TRBD2 TRBJ2… 14 15 24 #> 7 17 0.002 TGTGCC… CASTSL… TRBV6… TRBD1 TRBJ2… 9 25 29 #> 8 16 0.00188 TGCGCC… CASSLD… TRBV5… TRBD1 TRBJ2… 15 -1 -1 #> 9 15 0.00176 TGTGCC… CASTLR… TRBV28 TRBD1 TRBJ1… 9 19 21 #> 10 15 0.00176 TGCGCC… CASSQE… TRBV4… TRBD1 TRBJ2… 16 20 23 #> # … with 5 more variables: J.start <int>, VJ.ins <dbl>, VD.ins <dbl>, #> # DJ.ins <dbl>, Sequence <lgl> #> #> $`A4-i191` #> # A tibble: 10 x 15 #> Clones Proportion CDR3.nt CDR3.aa V.name D.name J.name V.end D.start D.end #> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <int> <int> <int> #> 1 449 0.0528 TGTGCC… CASSAF… TRBV9 TRBD2 TRBJ2… 12 19 24 #> 2 202 0.0238 TGCGCC… CACGGG… TRBV1… TRBD2 TRBJ1… 5 12 18 #> 3 187 0.022 TGTGCC… CASSSG… TRBV27 TRBD2 TRBJ2… 12 15 23 #> 4 143 0.0168 TGTGCC… CASSSG… TRBV6… TRBD1 TRBJ2… 12 14 21 #> 5 126 0.0148 TGCGCC… CASSQD… TRBV4… TRBD1 TRBJ2… 16 19 22 #> 6 83 0.00976 TGCGCC… CASSQV… TRBV4… TRBD2 TRBJ1… 15 17 21 #> 7 80 0.00941 TGTGCC… CASSLG… TRBV28 TRBD2 TRBJ2… 14 20 24 #> 8 68 0.008 TGTGCC… CASSFG… TRBV1… TRBD1 TRBJ2… 13 23 26 #> 9 66 0.00776 TGTGCC… CASSAG… TRBV7… TRBD1 TRBJ2… 11 15 21 #> 10 56 0.00659 TGCGCC… CASSLA… TRBV5… TRBD2 TRBJ1… 15 20 24 #> # … with 5 more variables: J.start <int>, VJ.ins <dbl>, VD.ins <dbl>, #> # DJ.ins <dbl>, Sequence <lgl> #> #> $`A4-i192` #> # A tibble: 11 x 15 #> Clones Proportion CDR3.nt CDR3.aa V.name D.name J.name V.end D.start D.end #> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <int> <int> <int> #> 1 150 0.0176 TGCGCC… CASSES… TRBV1… TRBD1 TRBJ2… 16 17 19 #> 2 124 0.0146 TGTGCC… CASIPP… TRBV7… TRBD2 TRBJ2… 9 30 38 #> 3 120 0.0141 TGCGCC… CASSSG… TRBV4… TRBD1 TRBJ1… 11 15 20 #> 4 115 0.0135 TGCAGT… CSARDI… TRBV2… TRBD1 TRBJ1… 13 18 20 #> 5 107 0.0126 TGTGCC… CASSRW… TRBV7… TRBD1 TRBJ2… 11 16 20 #> 6 101 0.0119 TGCAGT… CSARDF… TRBV2… TRBD1 TRBJ2… 13 24 31 #> 7 95 0.0112 TGTGCC… CASSPN… TRBV1… TRBD2 TRBJ1… 10 11 14 #> 8 76 0.00894 TGTGCC… CASSLI… TRBV27 TRBD1 TRBJ2… 14 17 19 #> 9 51 0.006 TGTGCC… CASSPK… TRBV18 TRBD2 TRBJ2… 14 18 24 #> 10 42 0.00494 TGTGCC… CASSPN… TRBV1… TRBD2 TRBJ1… 11 16 19 #> 11 42 0.00494 TGCGCC… CASSHP… TRBV4… TRBD2 TRBJ2… 13 17 28 #> # … with 5 more variables: J.start <int>, VJ.ins <dbl>, VD.ins <dbl>, #> # DJ.ins <dbl>, Sequence <lgl> #> #> $MS1 #> # A tibble: 10 x 15 #> Clones Proportion CDR3.nt CDR3.aa V.name D.name J.name V.end D.start D.end #> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <int> <int> <int> #> 1 539 0.0634 TGTGCC… CASSLQ… TRBV7… TRBD2 TRBJ2… 14 18 26 #> 2 320 0.0376 TGTGCC… CASSVY… TRBV9 TRBD1 TRBJ2… 13 20 22 #> 3 204 0.024 TGCAGT… CSTEED… TRBV2… TRBD1 TRBJ2… 5 14 19 #> 4 151 0.0178 TGCAGC… CSVELR… TRBV2… TRBD1 TRBJ2… 11 16 19 #> 5 98 0.0115 TGTGCC… CASSLG… TRBV5… TRBD1 TRBJ2… 15 16 22 #> 6 81 0.00953 TGCAGT… CSARDL… TRBV2… TRBD2 TRBJ2… 13 15 20 #> 7 76 0.00894 TGTGCC… CASSFE… TRBV7… TRBD1 TRBJ2… 13 16 22 #> 8 62 0.00729 TGCAGC… CSYRTG… TRBV2… TRBD1 TRBJ2… 5 10 20 #> 9 60 0.00706 TGTGCC… CASSLG… TRBV28 TRBD1 TRBJ2… 14 26 31 #> 10 38 0.00447 TGTGCC… CASSLY… TRBV7… TRBD2 TRBJ2… 14 17 19 #> # … with 5 more variables: J.start <int>, VJ.ins <dbl>, VD.ins <dbl>, #> # DJ.ins <dbl>, Sequence <lgl> #> #> $MS2 #> # A tibble: 10 x 15 #> Clones Proportion CDR3.nt CDR3.aa V.name D.name J.name V.end D.start D.end #> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <int> <int> <int> #> 1 97 0.0114 TGTGCC… CASSTR… TRBV28 TRBD1 TRBJ2… 10 15 20 #> 2 77 0.00906 TGCAGC… CSVEGG… TRBV2… TRBD1 TRBJ2… 12 13 17 #> 3 33 0.00388 TGTGCC… CASSLI… TRBV28 TRBD1 TRBJ2… 14 20 26 #> 4 32 0.00376 TGTGCC… CASSIT… TRBV27 TRBD1 TRBJ1… 11 16 18 #> 5 26 0.00306 TGCAGC… CSVEGG… TRBV2… TRBD2 TRBJ2… 12 13 16 #> 6 25 0.00294 TGTGCC… CASGSG… TRBV1… TRBD1 TRBJ2… 8 15 23 #> 7 24 0.00282 TGCAGT… CSAMGS… TRBV2… TRBD2 TRBJ2… 9 16 25 #> 8 22 0.00259 TGTGCC… CASSQG… TRBV7… TRBD1 TRBJ2… 11 12 17 #> 9 22 0.00259 TGTGCC… CASSPG… TRBV7… TRBD1 TRBJ2… 11 15 21 #> 10 21 0.00247 TGCAGT… CSAGRD… TRBV2… TRBD1 TRBJ2… 8 13 17 #> # … with 5 more variables: J.start <int>, VJ.ins <dbl>, VD.ins <dbl>, #> # DJ.ins <dbl>, Sequence <lgl> #> #> $MS3 #> # A tibble: 10 x 15 #> Clones Proportion CDR3.nt CDR3.aa V.name D.name J.name V.end D.start D.end #> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <int> <int> <int> #> 1 608 0.0715 TGTGCC… CASSQD… TRBV14 TRBD1 TRBJ2… 16 19 21 #> 2 291 0.0342 TGTGCC… CASSPT… TRBV1… TRBD1 TRBJ2… 11 14 22 #> 3 131 0.0154 TGTGCC… CASSQD… TRBV14 TRBD2 TRBJ2… 16 18 21 #> 4 115 0.0135 TGTGCC… CATSII… TRBV15 TRBD2 TRBJ2… 11 16 24 #> 5 78 0.00918 TGTGCC… CATSRL… TRBV15 TRBD2 TRBJ2… 11 13 24 #> 6 51 0.006 TGTGCC… CASSLG… TRBV5… TRBD1 TRBJ2… 15 23 26 #> 7 33 0.00388 TGTGCC… CASSPG… TRBV7… TRBD1 TRBJ2… 11 16 19 #> 8 33 0.00388 TGTGCC… CASSPG… TRBV7… TRBD2 TRBJ2… 11 15 27 #> 9 32 0.00376 TGTGCC… CAIRDP… TRBV1… TRBD1 TRBJ2… 10 17 20 #> 10 29 0.00341 TGTGCC… CASSLG… TRBV7… TRBD2 TRBJ2… 15 16 27 #> # … with 5 more variables: J.start <int>, VJ.ins <dbl>, VD.ins <dbl>, #> # DJ.ins <dbl>, Sequence <lgl> #> #> $MS4 #> # A tibble: 10 x 15 #> Clones Proportion CDR3.nt CDR3.aa V.name D.name J.name V.end D.start D.end #> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <int> <int> <int> #> 1 28 0.00329 TGTGCC… CASSVV… TRBV9 TRBD1 TRBJ2… 15 24 29 #> 2 27 0.00318 TGTGCC… CASSPD… TRBV7… TRBD1 TRBJ2… 11 21 24 #> 3 27 0.00318 TGTGCC… CATSRD… TRBV15 TRBD2 TRBJ2… 11 26 31 #> 4 24 0.00282 TGCGCC… CASQRE… TRBV4… TRBD2 TRBJ1… 8 15 18 #> 5 18 0.00212 TGTGCC… CASSHR… TRBV5… TRBD1 TRBJ2… 11 16 25 #> 6 16 0.00188 TGTGCC… CASSFV… TRBV1… TRBD1 TRBJ2… 13 17 23 #> 7 15 0.00176 TGTGCC… CASSYS… TRBV7… TRBD2 TRBJ2… 10 16 20 #> 8 15 0.00176 TGCGCC… CASRSG… TRBV5… TRBD1 TRBJ2… 10 16 26 #> 9 14 0.00165 TGTGCC… CAISDR… TRBV1… TRBD1 TRBJ1… 13 14 18 #> 10 14 0.00165 TGCAGC… CSATGD… TRBV2… TRBD1 TRBJ1… 7 9 15 #> # … with 5 more variables: J.start <int>, VJ.ins <dbl>, VD.ins <dbl>, #> # DJ.ins <dbl>, Sequence <lgl> #> #> $MS5 #> # A tibble: 10 x 15 #> Clones Proportion CDR3.nt CDR3.aa V.name D.name J.name V.end D.start D.end #> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <int> <int> <int> #> 1 433 0.0509 TGTGCC… CASSPG… TRBV1… TRBD1 TRBJ2… 10 13 19 #> 2 414 0.0487 TGTGCC… CASSPT… TRBV6… TRBD1 TRBJ2… 10 16 19 #> 3 272 0.032 TGTGCC… CASSDG… TRBV2… TRBD1 TRBJ1… 13 18 20 #> 4 233 0.0274 TGTGCC… CASSQG… TRBV7… TRBD1 TRBJ1… 11 14 19 #> 5 106 0.0125 TGTGCC… CASSLG… TRBV7… TRBD2 TRBJ2… 15 16 26 #> 6 79 0.00929 TGTGCC… CASRFK… TRBV6… TRBD2 TRBJ2… 10 18 27 #> 7 75 0.00882 TGTGCC… CASSLG… TRBV28 TRBD1 TRBJ2… 14 15 18 #> 8 55 0.00647 TGTGCC… CASSQD… TRBV3… TRBD2 TRBJ2… 16 24 27 #> 9 45 0.00529 TGCGCC… CASSQE… TRBV4… TRBD2 TRBJ1… 16 19 22 #> 10 40 0.00471 TGTGCC… CATSRV… TRBV15 TRBD2 TRBJ2… 11 16 23 #> # … with 5 more variables: J.start <int>, VJ.ins <dbl>, VD.ins <dbl>, #> # DJ.ins <dbl>, Sequence <lgl> #> #> $MS6 #> # A tibble: 11 x 15 #> Clones Proportion CDR3.nt CDR3.aa V.name D.name J.name V.end D.start D.end #> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <int> <int> <int> #> 1 46 0.00541 TGTGCC… CASSAT… TRBV27 TRBD1 TRBJ2… 11 14 18 #> 2 41 0.00482 TGCAGT… CSARDK… TRBV2… TRBD2 TRBJ2… 13 16 25 #> 3 29 0.00341 TGTGCC… CASSPL… TRBV1… TRBD1 TRBJ2… 11 19 23 #> 4 26 0.00306 TGTGCC… CASSPN… TRBV1… TRBD2 TRBJ1… 11 12 14 #> 5 21 0.00247 TGTGCC… CASGTG… TRBV7… TRBD1 TRBJ1… 8 9 16 #> 6 20 0.00235 TGCGCC… CASSLS… TRBV5… TRBD2 TRBJ2… 14 18 27 #> 7 18 0.00212 TGTGCC… CASSPN… TRBV1… TRBD1 TRBJ2… 11 19 21 #> 8 17 0.002 TGTGCC… CASSTG… TRBV6… TRBD2 TRBJ2… 11 14 26 #> 9 12 0.00141 TGTGCC… CASSDS… TRBV6… TRBD2 TRBJ2… 16 17 27 #> 10 11 0.00129 TGCAGT… CSARED… TRBV2… TRBD1 TRBJ1… 13 18 20 #> 11 11 0.00129 TGTGCC… CASSSP… TRBV27 TRBD2 TRBJ2… 12 13 17 #> # … with 5 more variables: J.start <int>, VJ.ins <dbl>, VD.ins <dbl>, #> # DJ.ins <dbl>, Sequence <lgl> #>
top(immdata$data[[1]])
#> # A tibble: 10 x 15 #> Clones Proportion CDR3.nt CDR3.aa V.name D.name J.name V.end D.start D.end #> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr> <int> <int> <int> #> 1 173 0.0204 TGCGCC… CASSQE… TRBV4… TRBD1 TRBJ2… 16 18 26 #> 2 163 0.0192 TGCGCC… CASSYR… TRBV4… TRBD1 TRBJ2… 11 13 18 #> 3 66 0.00776 TGTGCC… CATSTN… TRBV15 TRBD1 TRBJ2… 11 16 22 #> 4 54 0.00635 TGTGCC… CATSIG… TRBV15 TRBD2 TRBJ2… 11 19 25 #> 5 48 0.00565 TGTGCC… CASSPW… TRBV27 TRBD1 TRBJ1… 11 16 23 #> 6 48 0.00565 TGCGCC… CASQGD… TRBV4… TRBD1 TRBJ1… 8 13 19 #> 7 40 0.00471 TGCGCC… CASSQD… TRBV4… TRBD1 TRBJ2… 16 21 26 #> 8 31 0.00365 TGTGCC… CASSEE… TRBV2 TRBD1 TRBJ1… 15 17 20 #> 9 30 0.00353 TGCGCC… CASSQP… TRBV4… TRBD1 TRBJ2… 14 23 28 #> 10 28 0.00329 TGTGCC… CASSWV… TRBV6… TRBD1 TRBJ2… 12 20 25 #> # … with 5 more variables: J.start <int>, VJ.ins <dbl>, VD.ins <dbl>, #> # DJ.ins <dbl>, Sequence <lgl>