gobiclean : --save-graph enregistre comme délétion des "a -> n"
Un certain nombre de mutants dans le graphe sont erronés : ils sont enregistrés comme délétion alors que la base mutée est "n".
Voilà mon bout de code, à partir du jeu de données euka03.
Bash
#Après repérage...
gobigrep -c 2031 -C 2031 -l 138 -L 138 GWM-1107.sample.uniq.fasta > seq_mere
gobigrep -c 1307 -C 1307 -l 138 -L 138 GWM-1107.sample.uniq.fasta > seq_n_del
cat seq_mere seq_n_del > seq_n
gobiclean --save-ratio seq_n.csv --min-eval-rate 100 seq_n > seq_n.clean
R
`` #change path
graph_n <- read.csv("~/Documents/These/euka03/seq_n.csv")
graph_n
data_n <- read_obifasta("~/Documents/These/euka03/seq_n.clean")
counts <- extract_readcount(data_n, key = "merged_sample")
counts
#La comparaison montre que counts et graph_n traitent bien les mêmes séquences
substr(data_n$sequence[1], graph_n$Position[1]+1, graph_n$Position[1]+1)
substr(data_n$sequence[2], graph_n$Position[1]+1, graph_n$Position[1]+1)
#C'est la seule différence
which(sapply(1:nchar(b$sequence), function(i)(substr(data_n$sequence[1], i, i) != substr(data_n$sequence[2], i, i)))) ``