FLAM® Issue Tracker

View Revisions: Issue #875 All Revisions ] Back to Issue ]
Summary 0000875: support of tagged characters
Revision 2017-09-28 23:26 by Falk Reichbott
Description Hall Misha

Stichpunkte

- String-Latin 1.2 wird auf 692 Zeichen erweitert (hauptsächlich Satz
und Steuerzeichen), wann er kommt, steht noch nicht fest.

- Erfassungshilfen (Multibyte zeichen über Maskierung unterstützen (like
HTML (So/#rensen)))

- Eineindeutige Konvertierung im ICV (HTML(α) oder Deadkeys (o/#))
von EBCDIC nach UNICODE und von Unicode zu EBCDIC (Umkehrbare
Transliteration).

Es wäre eine sehr große Hilfe wenn wir folgendes könnten.

IBM1141 mit Maskierung der nicht enhaltenen Codepoints. Damit erschlägt
man gleich zwei Probleme.

1. man hat eine Eingabehilfe, die auch auf der 3270 geht. 2. Und man
kann zwischen 1141 und UNICODE hin und herkonvertieren ohne einen
Datenverlust zu haben.

Sprich es sollte in der Usertable eine Möglichkeit geben, für jden
Codepoint der nicht abbildbar ist, eine getagte Variante aus Codepoints
zuzuordnen, welche im Bereich 0x0020-0x80 liegen und wenns geht im
EBCDIC nicht diakritisch sind.

'&' CODEPOINT = code_point_list

wird übersetzt zum Beispiel in

    &ae; --> ä
    && --> &
        &0x31; --> 1
    

Wobei wir in der Lage sind diese getagten Zeichen beim Lesen mit dem ICV
in den CP zu wandeln, wenn diese Konvertrierung aktiviert wird
(MODE=tagging). Warum gibt es den Mode=translit nicht?

Schau mal welchen Aufwand dies machen würde. Und kopier mal die Mail als
issue in den Mantis.
Revision 2017-05-11 11:18 by Mykhailo Moldavskyy
Description Hall Misha

Stichpunkte

- String-Latin 1.2 wird auf 692 Zeichen erweitert (hauptsächlich Satz
und Steuerzeichen), wann er kommt, steht noch nicht fest.

- Erfassungshilfen (Multibyte zeichen über Maskierung unterstützen (like
HTML (So/#rensen)))

- Eineindeutige Konvertierung im ICV (HTML(α) oder Deadkeys (o/#))
von EBCDIC nach UNICODE und von Unicode zu EBCDIC (Umkehrbare
Transliteration).

Es wäre eine sehr große Hilfe wenn wir folgendes könnten.

IBM1141 mit Maskierung der nicht enhaltenen Codepoints. Damit erschlägt
man gleich zwei Probleme.

1. man hat eine Eingabehilfe, die auch auf der 3270 geht. 2. Und man
kann zwischen 1141 und UNICODE hin und herkonvertieren ohne einen
Datenverlust zu haben.

Sprich es sollte in der Usertable eine Möglichkeit geben, für jden
Codepoint der nicht abbildbar ist, eine getagte Variante aus Codepoints
zuzuordnen, welche im Bereich 0x0020-0x80 liegen und wenns geht im
EBCDIC nicht diakritisch sind.

'&' CODEPOINT = code_point_list

wird übersetzt zum Beispiel in

    &ae; --> ä
    && --> &
        &0x31; --> 1
    

Wobei wir in der Lage sind diese getagten Zeichen beim Lesen mit dem ICV
in den CP zu wandeln, wenn diese Konvertrierung aktiviert wird
(MODE=tagging). Warum gibt es den Mode=translit nicht?

Schau mal welchen Aufwand dies machen würde. Und kopier mal die Mail als
issue in den Mantis.


Copyright © 2000 - 2024 MantisBT Team
Powered by Mantis Bugtracker