0000875: support of tagged characters

FLAM® Issue Tracker

View Revisions: Issue #875		[ All Revisions ] [ Back to Issue ]
Summary	0000875: support of tagged characters

Revision	2017-09-28 23:26 by Falk Reichbott
Description	Hall Misha Stichpunkte - String-Latin 1.2 wird auf 692 Zeichen erweitert (hauptsächlich Satz und Steuerzeichen), wann er kommt, steht noch nicht fest. - Erfassungshilfen (Multibyte zeichen über Maskierung unterstützen (like HTML (So/#rensen))) - Eineindeutige Konvertierung im ICV (HTML(α) oder Deadkeys (o/#)) von EBCDIC nach UNICODE und von Unicode zu EBCDIC (Umkehrbare Transliteration). Es wäre eine sehr große Hilfe wenn wir folgendes könnten. IBM1141 mit Maskierung der nicht enhaltenen Codepoints. Damit erschlägt man gleich zwei Probleme. 1. man hat eine Eingabehilfe, die auch auf der 3270 geht. 2. Und man kann zwischen 1141 und UNICODE hin und herkonvertieren ohne einen Datenverlust zu haben. Sprich es sollte in der Usertable eine Möglichkeit geben, für jden Codepoint der nicht abbildbar ist, eine getagte Variante aus Codepoints zuzuordnen, welche im Bereich 0x0020-0x80 liegen und wenns geht im EBCDIC nicht diakritisch sind. '&' CODEPOINT = code_point_list wird übersetzt zum Beispiel in &ae; --> ä && --> & &0x31; --> 1 Wobei wir in der Lage sind diese getagten Zeichen beim Lesen mit dem ICV in den CP zu wandeln, wenn diese Konvertrierung aktiviert wird (MODE=tagging). Warum gibt es den Mode=translit nicht? Schau mal welchen Aufwand dies machen würde. Und kopier mal die Mail als issue in den Mantis.

Revision	2017-05-11 11:18 by Mykhailo Moldavskyy
Description	Hall Misha Stichpunkte - String-Latin 1.2 wird auf 692 Zeichen erweitert (hauptsächlich Satz und Steuerzeichen), wann er kommt, steht noch nicht fest. - Erfassungshilfen (Multibyte zeichen über Maskierung unterstützen (like HTML (So/#rensen))) - Eineindeutige Konvertierung im ICV (HTML(α) oder Deadkeys (o/#)) von EBCDIC nach UNICODE und von Unicode zu EBCDIC (Umkehrbare Transliteration). Es wäre eine sehr große Hilfe wenn wir folgendes könnten. IBM1141 mit Maskierung der nicht enhaltenen Codepoints. Damit erschlägt man gleich zwei Probleme. 1. man hat eine Eingabehilfe, die auch auf der 3270 geht. 2. Und man kann zwischen 1141 und UNICODE hin und herkonvertieren ohne einen Datenverlust zu haben. Sprich es sollte in der Usertable eine Möglichkeit geben, für jden Codepoint der nicht abbildbar ist, eine getagte Variante aus Codepoints zuzuordnen, welche im Bereich 0x0020-0x80 liegen und wenns geht im EBCDIC nicht diakritisch sind. '&' CODEPOINT = code_point_list wird übersetzt zum Beispiel in &ae; --> ä && --> & &0x31; --> 1 Wobei wir in der Lage sind diese getagten Zeichen beim Lesen mit dem ICV in den CP zu wandeln, wenn diese Konvertrierung aktiviert wird (MODE=tagging). Warum gibt es den Mode=translit nicht? Schau mal welchen Aufwand dies machen würde. Und kopier mal die Mail als issue in den Mantis.