amiga-news ENGLISH VERSION
.
Links| Forum| Kommentare| News melden
.
Chat| Umfragen| Newsticker| Archiv
.

amiga-news.de Forum > Amiga, AmigaOS 4 > Probleme mit ASCI-Cods! In meinen Emails [ - Suche - Neue Beiträge - Registrieren - Login - ]

-1- [ - Beitrag schreiben - ]

28.11.2004, 23:14 Uhr

Archeon
Posts: 1810
Nutzer
Hallo Freunde! Habe da Problem was sich schon länger bei mir
meldete. Und zwar werden bei mir nicht mehr die Asci-Cods richtig dar gestellt.
Texte sind total verfremdet. Es tritt meist bei Sonderzeichen wie Ä,Ö.Ü,ß und eininge andere Buchstaben auf.
Ich bekomme dann dauern Sonderzeichen die den Text verfremden.
Kennt jemand da ne Lösung.

[i]Beispieltext:

c't.
Auf positive Bewertungen sind vor allem die so genannten Powerseller
angewiesen, die den Handel über eBay regelmäà ig und professionell
betreiben. Ein ungünstiges Bewertungsprofil ist gleichzusetzen mit einem
schlechten Ruf und verdirbt das Geschäft. Deshalb reagieren vor allem
die gewerblichen Anbieter empfindlich auf negative Kommentare und
beschäftigen damit oft sogar die Gerichte. "Also, ich und ein Freund
würden hier ganz bestimmt nichts mehr kaufen, sorry!!"/i]

Im PC-Bereich gibt es zwei Einstellungen.
Westeuropäisch
und ne ander Bezeichnung der mit momentan nicht einfällt.
Jedenfalls wenn ich diese Textcod einstellen, ist auf dem PC alles normal
nur der Text erscheid fehlerhaft auf den Amiga.

[ - Antworten - Zitieren - Direktlink - ]

29.11.2004, 00:46 Uhr

Jinx
Posts: 2077
Nutzer
Es gibt mehr als nur 2 Kodierungen.. Beispiele wären Unicode, Iso Latin usw... Ich glaube, Yam hat eine Funktion um das automatisch zu machen, auf jeden Fall aber gehts manuell. Das Problem, dass manche Mails "komisch aussehn" wird aber im manuellen Fall weiterhin bestehen.
--
eMail: TheJinx@web.de
Homepage: http://www.TheJinx.de

[ - Antworten - Zitieren - Direktlink - ]

29.11.2004, 02:40 Uhr

cgutjahr
Posts: 2782
[Administrator]
Was du da siehst, sind keine "ASCII-Codes", das ist "Unicode".

Mit ASCII (bzw. Erweiterungen und Abwandlungen von ASCII) kannst du maximal 256 verschiedene Zeichen darstellen.

Für das Internet, wo theoretisch der Fall eintreten kann dass ein Schwede mit einem Russen per E-Mail diskutiert und einem deutsch-türkischen Ehepaar Durschläge der Mails schickt, ist das aber deutlich zu wenig: Stell dir vor alle genannten Personen haben Nachnamen die mit Sonderzeichen ihrer Muttersprache gespickt sind.

Das ist einer der Gründe für die Entwicklung von "Unicode". Bei Unicode wird einem Zeichen nicht mehr nur ein Byte zugeordnet, sondern zwei - schau dir die von dir gepostete E-Mail an und du wirst feststellen, dass alle Umlaute durch zwei Zeichen ersetzt wurden. Damit kann man 65536 verschiedene Zeichen darstellen.

Das Problem ist, dass weder AmigaOS noch YAM Unicode beherrschen - du wirst vorerst mit dem Problem leben müssen. YAM kann zwar Zeichensätze beim Einlesen einer Mail konvertieren, aber immer nur Eingangszeichen -> Ausgangszeichen. Mit Unicode kommt es nicht klar, denn dafür müsste es zwei Eingangszeichen in ein Ausgangszeichen umrechnen (z.B. "ä" = "ä").

--
Gutjahrs :amiga: Seiten

[ - Antworten - Zitieren - Direktlink - ]

29.11.2004, 07:21 Uhr

Micha1701
Posts: 938
Nutzer
Sicher das YAM nicht unicode in ASCII konvertieren kann?

Immerhin macht es ja aus 2 Byte Unicode 1 Byte ASCII Code... ;-)

Scheint nur probleme mit den Umlauten zu haben...


--
:boing: Micha :boing:

Look at my HPs:
http://www.lanser-online.de.vu

http://www.RealmsofPower.de.vu



[ - Antworten - Zitieren - Direktlink - ]

29.11.2004, 07:58 Uhr

Palgucker
Posts: 1342
Nutzer
@ cgutjahr

quote:

Was du da siehst, sind keine "ASCII-Codes", das ist "Unicode".

jein

Was Archeon da sieht, ist UTF-8 Code. Siehe z.B. hier.


Unicode besteht immer aus mindestens 2 Byte pro Character - auch die ganz normalen Zeichen. Zur Unterscheidung werden Unicode-Texte mit der Zeichenfolge "ÿþ" eingeleitet.
UTF-8 belässt dagegen alle "normalen" Zeichen so wie sie sind, und codiert nur ASCII-Werte oberhalb 127.

mfg Palgucker

p.s. Um welche codierung es sich handelt, sollte im E-mail-Header unter "charset=" zu finden sein.






[ Dieser Beitrag wurde von Palgucker am 29.11.2004 editiert. ]

[ - Antworten - Zitieren - Direktlink - ]

29.11.2004, 10:16 Uhr

Eule
Posts: 1607
Nutzer
Grundwissen

ASCII ist ein 7 Bit Code.

Das A in ASCII steht für 'American' und daher hat dieser Code keine Umlaute. Es agb auch deutsche Verionen von ACSII bei denen die z.B. die Klammern [] durch ä und ü ersezt wurden. Damit konnte man alle Umlaute und auch das ß darstellen bleib aber bei 7Bit.

7Bit ASCII ist etwas was seit der Zeit des C64 der Vergangenheit angehört. Es gibt unter DOS eine Erweiterung auf 8-Bit die auch die euopäischen Umlaute beinhaltet. Aber diese ist eigentlich nur ein IBM Zeichencode und hat seit dem Ende von DOS nicht mehr viel zu sagen.

Amiga und Windows

Der Amiga und Winows benutzen einen 8-Bit Code der den Namen 'ISO-8859-1' trägt. Er wird auch als International Westeuropa angegeben. Er ist bei den Codes vom 0-126 mit dem ASCII Code identisch. Erst bei den Zeichencodes über 160 kommen alle Sonderzeichen aus dem Westeuropäischen Raum.

Damit lassen sich die Sprachen Deutsch, Französisch Schwedisch, Norwegisch und auch Türkisch korrekt darstellen.

Aber schon bei den Sonderzeichen aus Polen versagt dieser Code.

Soweit mir bekannt ist die Osteuropäische Version der Code mit dem Namen 'ISO-8859-2' auch er ist ein 8-Bit Code.

Der Apple Macintosch benutzt eine eigenen Version des 8_Bit Codes die immer wieder zu Fehlern in Tecxten oder auf WWW Seiten führt.

16Bit Unicode

Seit längerem gibt es einen 16Bit Code den sogenannten UNI-Code. Dieser Code beinhaltet einen wesentlich größeren Zeichensatz. Es ist mit ihm möglich, japanische, russische sowie europäische Zeichen darzustellen. Ursprünglich war sogar der Umstieg auf einen 32Bit Code angedacht. Damit wären auch chinesische Buchstaben möglich geworden.

Bei Windows wird intern schon sehr viel mit dem 16Bit Unicode gearbeitet. Fehler können oft bei der Umformung von 16Bit zu 8Bit-ISO und wieder zurück geschehen.

HTML

Bei der Darstellung der Sonderzeichen in HTML ist zwar die Benutzung der 8-Bit Codes nach der Angabe der ISO-Tabelle erlaubt aber eine Rückführung auf 7Bit ASCII Zeichen ist durchaus üblich: ( Ü = ü ) ;

Das Problem mit dem Text bei der C't hab ich schon öfters gesehen.
Ich gebe ehrlich zu, dass ich nicht genau weiß, wie die Probleme zustande kommen, weil diese Art der Codierung nirgends richtig erklärt wird.

Bei 16Bit Unicode ist es nicht üblich mitten im 8-Bit Text ein 16-Bit Zeichen zu benutzen. Geshen hab ich solche Dinge hauptsächlich bei Texten die von MACs geschrieben wurden.

Was diese Codierung soll und wie sie aufgelöst wird .... ich weiß es nicht. Wenn es wirklich UNI-Code ist, dann muss erst mit einem Sondersymbol ein 'Hallo hier commt UNI-Code' signalisiert werden.

Für jede ernstgemeinte Erklärung bin ich dankbar aber bitte fangt nicht an die Begriffe ASCI zu benutzen wenn ISO gemeint ist ....

[ - Antworten - Zitieren - Direktlink - ]

29.11.2004, 10:21 Uhr

Eule
Posts: 1607
Nutzer
Zitat:
Original von Palgucker:

Was Archeon da sieht, ist UTF-8 Code. Siehe z.B. hier.


....

UTF-8 belässt dagegen alle "normalen" Zeichen so wie sie sind, und codiert nur ASCII-Werte oberhalb 127.


Danke, das macht Sinn ich denke ich werde es mir mal ausdrucken.

cu Eule



[ - Antworten - Zitieren - Direktlink - ]

29.11.2004, 12:30 Uhr

Palgucker
Posts: 1342
Nutzer
@ Eule

quote:

Was diese Codierung soll und wie sie aufgelöst wird .... ich weiß es nicht. Wenn es wirklich UNI-Code ist, dann muss erst mit einem Sondersymbol ein 'Hallo hier commt UNI-Code' signalisiert werden.

Wie ich schon schrieb, dieses "Hallo hier kommt UNI-Code" ist die simple Zeichenfolge "ÿþ". Als Beispiel kannst Du Dir ja mal den Quelltext dieser ansehen.
Ein UTF-8 Converter dürfte übrigens auch nicht allzu schwierig zu schreiben sein.
Mal sehen, ob ich in Arexx einen verbrechen kann.

mfg Palgucker

[ - Antworten - Zitieren - Direktlink - ]

29.11.2004, 13:17 Uhr

Palgucker
Posts: 1342
Nutzer
So in etwa könnte es mi Arexx funktionieren.
code:
/* convert utf-8 to latin */
Parse Arg File

IF ~SHOW('LIBRARIES','rexxsupport.library') THEN DO
   IF ~ADDLIB('rexxsupport.library',10,-30,0) THEN DO
      SAY 'Kann die <rexxsupport.library> nicht öffnen!'
      EXIT(10)
   END
END

L=SUBWORD(STATEF(File),2,1)
Call Open(File,File,R)
Convertfile="Ram:convert.txt"
Call Open(Convertfile,Convertfile,W)
Do Dl=1 To L
Chr=Readch(File,1)
   If BitTst(Chr,7) Then Do
      Z=0
         Do Until ~BitTst(Chr,7-Z)
         Z=Z+1
         End
      CHR$=Substr(C2B(Chr),8-Z,Z+1)
         Do I = 1 To Z-1
         Chr=Readch(File,1)
         Dl=Dl+1
         CHR$=Chr$ || Substr(C2B(Chr),3,6)
         End
   Chr=D2C(C2D(B2C(Chr$))*1)
   If C2D(Chr) = 8364 Then Chr = D2C(164) /* Euro */
   End
Wr=Writech(Convertfile,Chr)
End
Cl=Close(File)
Cl=Close(Convertfile)


mfg Palgucker

[ - Antworten - Zitieren - Direktlink - ]

29.11.2004, 15:32 Uhr

Brunadi
Posts: 1365
Nutzer
Hallo Archeon

Ich nehme an, Du meinst die mails in YAM. Dann sie nach, ob das
localCharset auf iso-8859-1 gestellt ist.

Das kannst aber nicht im Einstellungsmenu ändern, sondern Du
lädst die Datei .config aus dem YAM-Verzeichnis in einen Texteditor
und gehst zum Abschnitt [Advanced], ist ziemlich am Schluß, dort
müßte eine Zeile stehen:
localcharset = iso-8859-1


Gruß Brunadi :rotate:
--
http://brunadi.8ung.at


Die meisten Computerfehler sitzen vor dem Bildschirm


[ - Antworten - Zitieren - Direktlink - ]


-1- [ - Beitrag schreiben - ]


amiga-news.de Forum > Amiga, AmigaOS 4 > Probleme mit ASCI-Cods! In meinen Emails [ - Suche - Neue Beiträge - Registrieren - Login - ]


.
Impressum | Datenschutzerklärung | Netiquette | Werbung | Kontakt
Copyright © 1998-2024 by amiga-news.de - alle Rechte vorbehalten.
.