Der Stammbaumdrucker arbeitet intern mit dem Unicode-Zeichensatz. Damit können unabhängig vom Zeichensatz des eingerichteten Gebietsschemas Zeichen verschiedener Sprachen kombiniert werden, zum Beispiel kann man bei einem eingerichteten deutschsprachigen Gebietsschema einem griechischen Geburtsort die original Schreibweise zufügen: Athen - Αθήνa.
Einschränkungen:
| • | Unicode wird nicht unter Windows 98 und ME unterstützt. Der Stammbaumdrucker arbeitet unter diesen Betriebssystemen einwandfrei, aber nur mit dem ANSI-Zeichensatz des eingerichteten Gebietsschemas. Ein Betrieb mit dem MSLU (Microsoft (1) Layer für Unicode) wurde nicht getestet. |
| • | Es können nur Schriften verwendet werden, die in den Zeilen von links nach rechts verlaufen und deren Zeilen von oben nach unten verlaufen. |
| • | Es können nur Schriftarten verwendet werden, die einen ausreichend umfangreichen Unicode-Zeichensatz enthalten. Dies ist unter alten Windows-Versionen oder bei exotischen Schriftarten nicht sicher. Zur Prüfung des Inhalts einer Schriftart kann man das Windows-Programm Zeichentabelle verwenden: Start -> Programme -> Zubehör -> Systemprogramme -> Zeichentabelle. |
| • | Unicode wird nicht für die genealogischen Symbole unterstützt. |
| • | Von der Verwendung von Dateinamen mit Unicode-Zeichen, die nicht in der Codepage des eingerichteten Gebietsschemas enthalten sind, wird abgeraten. Zwar kann der Stammbaumdrucker damit umgehen, aber andere Programme, mit denen Sie zum Beispiel Ihre Dateien sichern wollen, können es eventuell nicht. |
| • | Für die Namen von Dokumentdateien, die automatisch an Archiv-PDF-Dateien angehängt werden, sollten sogar nur Zeichen des ASCII-Zeichensatzes verwendet werden. Details hierzu finden Sie im Abschnitt Die Erzeugung von Archiv-PDF-Dateien. |
Unicode in PDF-Dateien:
Hier verwendete Begriffe:
| • | Fremdsprache bezeichnet eine Sprache, deren Zeichen nicht komplett mit der Codepage des eingerichteten Gebietsschemas darstellbar sind. |
| • | Fremdzeichen bezeichnet ein Zeichen, das nicht mit der Codepage des eingerichteten Gebietsschemas darstellbar ist. |
In PDF-Dateien erfolgt die Text-Speicherung normalerweise mit einer einzigen Codepage, sodass innerhalb einer Zeichenkette (in der Regel: innerhalb einer Zeile) nur Zeichen aus dieser einen Codepage ausgegeben werden können. Damit sind Kombinationen von Fremdzeichen aus mehreren Fremdsprachen innerhalb einer Zeichenkette nicht möglich; zum Beispiel kann nicht 'Deutschland Россия Ελλada' ausgegeben werden, da die kyrillischen und die griechischen Fremdzeichen nicht in einer einzigen Codepage zusammen vorkommen. Die Ausgabe von 'Deutschland Россия' oder 'Deutschland Ελλada' ist aber möglich, da in der kyrillischen und der griechischen Codepage auch die lateinischen Buchstaben enthalten sind.
Der Stammbaumdrucker verwendet aber einen besonders leistungsfähigen PDF-Generator, der mit der PDF-Option CID Unicode eine beliebige Kombination von Fremdzeichen aus beliebig vielen Fremdsprachen erlaubt. CID Unicode ermöglicht eine zeichensatzunabhängige Schriftart-Einbettung. Wenn Sie also in Ihren Texten Zeilen mit Kombinationen aus Fremdzeichen aus mehr als nur einer einzigen Fremdsprache haben, aktivieren Sie beim PDF-Export die PDF-Option CID Unicode. Die PDF-Edition dieses Handbuchs wurde auch mit CID Unicode erzeugt, um das Beispiel 'Deutschland Россия Ελλada' richtig darstellen zu können.
Alphabetische Sortierung:
Die alphabetische Sortierung richtet sich im wesentlichen nach der Codierung im Zeichensatz. Kyrillische und griechische Buchstaben stehen zum Beispiel hinter den lateinischen Buchstaben.
Details zu den verschiedenen Unicode-Dateien:
Außer den Bild-/Grafik- und PDF-Dateien sind alle vom Stammbaumdrucker verwendeten Dateien Text-Dateien.
Der Stammbaumdrucker liest Unicode-Text-Dateien (Unicode-Gedcom-Dateien siehe unten) mit den folgenden Unicode-Zeichensätzen:
| • | UTF-8 |
| • | UTF-16 Little Endian |
| • | UTF-16 Big Endian |
Er schreibt Unicode-Text-Dateien (Unicode-Gedcom-Dateien siehe unten) stets mit dem Zeichensatz:
| • | UTF-16 Little Endian |
Der Stammbaumdrucker kann Unicode-Gedcom-Dateien mit den folgenden Unicode-Zeichensätzen importieren:
| • | UTF-8 |
| • | UNICODE (UTF-16 Little Endian) |
| • | UNICODE (UTF-16 Big Endian) |
Er kann Unicode-Gedcom-Dateien mit den folgenden Unicode-Zeichensätzen exportieren:
| • | UTF-8 |
| • | UNICODE (UTF-16 Little Endian) |
Hinweis: UTF-8 ist auch Unicode, aber anders codiert als UTF-16. Es ist üblich, für Gedcom-Dateien 'UTF-8' oder 'UNICODE' anzugeben; dabei steht 'UNICODE' für UTF-16 Little Endian oder UTF-16 Big Endian. |
(1) Microsoft Corporation