Das deutsche QBasic- und FreeBASIC-Forum

Berkeley · Anmeldungsdatum: 13.05.2024 Beiträge: 118

- PRINT benutzt unter Windows ja Codepage "OEM 850". Benutzt Linux automatisch UTF-8 ? Kann man die Codierung aus dem Programm raus ändern, ist es ggf. festgenagelt dass man sich auf Windows verlassen kann und was kann man sonst so tun ?

Ist ja irgendwie dumm... FBEdit benutzt auch eine andere Codierung; wenn man Text mit Umlauten ausgeben will... Und unter Linux kommt dann ja auch wieder Zeichenmüll raus.

nemored · Anmeldungsdatum: 22.02.2007 Beiträge: 4727 Wohnort: ~/

nemored · Anmeldungsdatum: 22.02.2007 Beiträge: 4727 Wohnort: ~/

Ach ja, ganz vergessen:

mit WCHR kannst du ein einzelnes Unicode-Zeichen ausgeben. Das mit der BOM ist nur wichtig, wenn die Unicode-(Nicht-ASCII-)Zeichen direkt im Quellcode stehen.
https://www.freebasic-portal.de/befehlsreferenz/wchr-143.html
https://www.freebasic.net/wiki/KeyPgWchr

Und dann unterstützt auch nicht jede Schriftart alle Unicode-Zeichen. Wie das mit der eingestellten Konsolenschriftart aussieht, musst du ausprobieren. (Allerdings sehe ich gerade, dass das im englischen Artikel dabeisteht.)
_________________
Deine Chance beträgt 1:1000. Also musst du folgendes tun: Vergiss die 1000 und konzentriere dich auf die 1.

-----

"Das wissen doch sowieso nur Nerdinauten, die Schlaumeierologie studiert haben." - coldmirror

Berkeley · Anmeldungsdatum: 13.05.2024 Beiträge: 118

BOM bringt schon mal null. Aber Microsoft überrascht mich auch nur seltenst positiv, obwohl ich nicht gerade die höchste Meinung von ihnen habe.

Ausgabe in UTF-16 funzt scheinbar. Microsoft kann schlicht kein UTF-8. Braucht also wieder mal nen Extracode... Zum Glück braucht's PRINT nur für ein paar Konsolenausgaben...

- Und was macht Linux ?

nemored · Anmeldungsdatum: 22.02.2007 Beiträge: 4727 Wohnort: ~/

Soweit ich weiß, setzt Unix/Linux schon seit etwa 30 Jahren voll auf UTF-8.

Was intern genau passiert, kann ich nicht sagen, aber das Programm

Berkeley · Anmeldungsdatum: 13.05.2024 Beiträge: 118

Ikes, wenn das stimmt, dann bestimmt der Compiler die richtige Codierung bei PRINT... Ich hab' die BOM an den Anfang meiner Strings gesetzt... Im Quelltext selbst benutz' ich eh praktisch nur ASCII, zumindest bei Releaseversionen.

Nachtrag, nach Tests: FbEdit kommt mit UTF-8 nicht klar, die BOM wird im Quelltext sichtbar ausgegeben. Beim Build kriegt der Compiler ein Problem mit Umlauten - weil FbEdit halt nicht auf UTF-8 kodiert, sondern offensichtlich ISO 8859. Unabhängig davon aber akzeptiert die Windowskonsole trotzdem kein UTF-8, dafür läuft sie auf ISO 8859, nicht mehr Codepage 850...

Grundsätzlich bin ich schon mal froh, wenn man sich drauf verlassen kann dass jede andere für mich relevante Zielplattform (Linux+Mac OS zwinkern

) UTF-8 verwendet.

nemored · Anmeldungsdatum: 22.02.2007 Beiträge: 4727 Wohnort: ~/

Ich verwende Geany und bin damit äußerst zufrieden - ist halt ein Universaleditor und keine IDE spezifisch für FreeBASIC. Aber Codierungsumstellungen sind damit absolut problemlos.

Der Compiler bestimmt nicht das Verhalten von PRINT (naja, eigentlich schon grinsen

), sondern die Interpretation des Stringinhalts. Die BOM gibt dem Compiler zu verstehen, dass Strings als Unicode aufzufassen sind, in der durch die BOM festgelegten Codierung.

Ansonsten ist der richtige Datentyp der WSTRING, der von der Windowskonsole dann auch korrekt übernommen werden müsste - natürlich wieder wenn die Nicht-ASCII-Zeichen korrekt im WSTRING gelandet sind. Intern arbeitet FreeBASIC dann mit UTF-16 oder UTF-32, je nach Betriebssystem.

Und ja, durchaus möglich, dass Windows nur UTF-16 kann und kein UTF-8. Unicode ist halt noch sehr neu. durchgeknallt

_________________
Deine Chance beträgt 1:1000. Also musst du folgendes tun: Vergiss die 1000 und konzentriere dich auf die 1.

-----

"Das wissen doch sowieso nur Nerdinauten, die Schlaumeierologie studiert haben." - coldmirror

grindstone · Verfasst am: 13.08.2024, 22:53 Titel:

Hallo!

Zu diesem Thema hatten wir vor einigen Jahren schon einmal einen Thread.
Vielleicht findest du da etwas, was dir weiterhilft.

Gruß
grindstone
_________________
For ein halbes Jahr wuste ich nich mahl wie man Proggramira schreibt. Jetzt bin ich einen!

Matthias · Gast

unter Linux benutzt PRINT normalerweise UTF-8, da das die Standard-Kodierung der meisten modernen Systeme ist. Windows nutzt oft OEM 850 oder andere Codepages, je nach Konsole. In vielen Programmiersprachen kannst du die Ausgabe-Kodierung explizit setzen, z.B. in Python über `encode()` oder in C++ mit entsprechenden Bibliotheken. Wenn du plattformübergreifend arbeiten willst, empfiehlt es sich, intern immer UTF-8 zu benutzen und die Konvertierung erst am Rand durchzuführen. Für Konsolenprogramme kannst du auch auf Libraries zurückgreifen, die Unicode besser unterstützen.

Monika · Anmeldungsdatum: 03.07.2025 Beiträge: 9

Hallo! Unter Linux wird normalerweise UTF-8 verwendet, aber ältere Druckbefehle wie `lpr` oder Shell-Programme können auch andere Codierungen erwarten. Es ist also nicht garantiert, dass es ohne Anpassung klappt. Du kannst mit `iconv` Textdateien in die gewünschte Codierung umwandeln (zum Beispiel von UTF-8 nach ISO-8859-1). Für portablen Code empfiehlt sich, die Ausgabecodierung programmatisch festzulegen oder als Option einstellbar zu machen. Umlaute bleiben sonst leider ein Problem zwischen den Systemen.

Berkeley · Anmeldungsdatum: 13.05.2024 Beiträge: 118

Ich hab' dafür meine UTF8-Bibliothek: https://www.freebasic-portal.de/downloads/bibliotheken/utf8-library-411.html, da ist auch Umwandlung von ISO/IEC 8859 drin, für die Windows-Konsole muss man "nur" in UTF-16 umwandeln.
Schaut bei mir so aus: