Danke für deine Antwort!
ich hab das grade ausprobiert, aber die formatierung läuft nicht exakt, es wird nicht regelmäßig nach 70 Buchstaben umgebrochen.
Mein COde sieht bisher so aus:
Siehst du den Fehler ?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
while (<FILE1>){
if (/(.*)\n([A-Za-z\n]+)/){
($header,$seq)=($1,$2);
$seq=~s/\s//g;
if ($i=$seq=~s/($pattern_neu)/<span class='stil3'>$1<\/span>/g){
$seq =~ s/([A-Z]{70})/$1<br>/sg;
open FILE2,">>../docs/Site/files/pattern_html/$pattern_html.htm";
print FILE2 "<font size='2'><strong>>$header<\/strong><\/font><br><font size='2'>$seq<\/font><p>";
close(FILE2);
$Anzseq=$Anzseq+1;
$Anzpattern+=$i;
print STDERR (length $seq)."\n";
}
}
}
close FILE1;
Die Textdatei die in den Filehandle eingelesen wird hat folgende Form:
>uniprot|P67817|HBA_ATEGE Hemoglobin alpha subunit (Hemoglobin alpha chain) (Alpha-globin).
VLSPADKSNVKAAWGKVGGHAGDYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHGK
KVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHHPADFTPA
VHASLDKFLASVSTVLTSKYR
>uniprot|P41331|HBA_MICGA Hemoglobin alpha subunit (Hemoglobin alpha chain) (Alpha-globin).
VLTEEDKARVRVAWVPVSKNAELYGAETLTRLFAAHPTTKTYFPHFDLSPGSNDLKVHGK
KVIDALTEAVNNLDDVAGALSKLSDLHAQKLRVDPDNFQFLGLCLEVTIAAHSGGPLKPE
VLLSVDKFLGQISKVLASRYR
>uniprot|P02011|HBA3_RANCA Hemoglobin alpha-3 subunit (Hemoglobin alpha-3 chain) (Alpha-3-globin) (Hemoglobin alpha-III chain, larval).
SLSASEKAAVLSIVGKIGSQGSALGSEALTRLFLSFPQTKTYFPHFDLTPGSADLNTHGG
KIINALAGAANHLDDLAGNLSSLSDLHAYNLRVDPGNFPLLAHIIQVVLATHFPGDFTAE
VQAAWDKFLALVSAVLTSKYR
>uniprot|Q9XSE9|HBA_EQUPR Hemoglobin alpha subunit (Hemoglobin alpha chain) (Alpha-globin).
VLSAADKTNVKAAWSKVGGHAGEFGAEALERMFLGFPTTKTYFPHFDLSHGSAQVKAHGK
KVGDALTLAVGHLDDLPGALSNLSDLHAHKLRVDPVNFKLLSHCLLSTLAVHLPNDFTPA
VHASLDKFLSSVSTVLTSKYR