Thread Marker fürs Bearbeiten bestimmter Bereiche in Textdatei gesucht (11 answers)
Opened by Pauline25 at 2011-08-10 14:06

Pauline25
 2011-08-10 15:37
#151480 #151480
User since
2011-08-03
13 Artikel
BenutzerIn
[default_avatar]
Hallo. Ich antworte auf beides gleichzeitig: Die folgenden Textzeilen enthalten die Informationen für ein Gen:

NC_014171.1 RefSeq gene 18622 19509 . + . locus_tag=BMB171_C0010;db_xref=GeneID:9191051
NC_014171.1 RefSeq CDS 18622 19506 . + 0 locus_tag=BMB171_C0010;transl_table=11;product=pyridoxine biosynthesis protein;protein_id=YP_003662548.1;db_xref=GI:296500848;db_xref=GeneID:9191051;exon_number=1

nun folgen ein paar Zeilen, die ich gar nicht brauche, mit ziemlich unterschiedlichem Inhalt. Irgendwann taucht dann wieder das Wort gene und somit ein neuer Datensatz auf:

NC_014171.1 RefSeq gene 22134 22526 . + . locus_tag=BMB171_C0013;db_xref=GeneID:9190939
NC_014171.1 RefSeq CDS 22134 22523 . + 0 locus_tag=BMB171_C0013;transl_table=11;product=hypothetical protein;protein_id=YP_003662551.1;db_xref=GI:296500851;db_xref=GeneID:9190939;exon_number=1

und so weiter. Wie viele Zeilen pro Gen ist unterschiedlich. Der Punkt, ab dem man sagen kann, dass nun ein neuer Datensatz kommt ist das Auftauchen des Wortes gene. Die Informationen, die direkt vor diesem Wort kommen sind immer identisch und zwischen den einzelnen Blöcken, die ich bearbeiten will (siehe Beispiel oben) steht eben ziemlich viel, mit dem ich nichts anfangen kann, was aber auch kein richtiges Muster aufweist.

Kannst du damit was anfangen?

View full thread Marker fürs Bearbeiten bestimmter Bereiche in Textdatei gesucht