Thread Einlesen mehrerer Dateien (38 answers)
Opened by Alex at 2013-04-23 11:08

Linuxer
 2013-05-02 15:40
#167398 #167398
User since
2006-01-27
3870 Artikel
HausmeisterIn

user image
Wieviel Enzymsequenzen sollen denn aus den Dateien extrahiert werden? Ich hatte es so verstanden, dass alle ausgelesen werden sollen.

Wenn also Datei 1 (vereinfacht) so aufgebaut ist
Code: (dl )
1
2
3
4
> enzym 1 [organismus adam]
AAAAAAAAA
> enzym 2 [organismus adam]
BBBBBBBBB


dann landen eben die extrahierten Sequenzen (AAA + BBB) zuerst in der Ausgabedatei.
Wenn dann Datei 2 auch nochmal 2 Gensequenzen (seien es CCC + DDD) enthält, dann landen diese danach auch in der Ausgabedatei, die dann wohl so aussehen würde:

Code: (dl )
1
2
> organismus adam
AAABBBCCCDDD


Es werden erst alle Sequenzzeilen aus Datei 1 ausgewertet und gesammelt, danach dann alle Sequenzzeilen aus Datei 2. In der Ausgabe landen dann zuerst alle aus Datei 1 und danach alle aus Datei 2, wobei alle Sequenzen einfach aneinander geschrieben werden.


Tiefergehend kann ich mich erst entweder heute spät am Abend oder erst morgen/am Wochenende damit weiter befassen.
meine Beiträge: I.d.R. alle Angaben ohne Gewähr und auf Linux abgestimmt!
Die Sprache heisst Perl, nicht PERL. - Bitte Crossposts als solche kenntlich machen!

View full thread Einlesen mehrerer Dateien