Das deutsche QBasic- und FreeBASIC-Forum

Berkeley · Anmeldungsdatum: 13.05.2024 Beiträge: 91

- PRINT benutzt unter Windows ja Codepage "OEM 850". Benutzt Linux automatisch UTF-8 ? Kann man die Codierung aus dem Programm raus ändern, ist es ggf. festgenagelt dass man sich auf Windows verlassen kann und was kann man sonst so tun ?

Ist ja irgendwie dumm... FBEdit benutzt auch eine andere Codierung; wenn man Text mit Umlauten ausgeben will... Und unter Linux kommt dann ja auch wieder Zeichenmüll raus.

nemored · Anmeldungsdatum: 22.02.2007 Beiträge: 4699 Wohnort: ~/

nemored · Anmeldungsdatum: 22.02.2007 Beiträge: 4699 Wohnort: ~/

Ach ja, ganz vergessen:

mit WCHR kannst du ein einzelnes Unicode-Zeichen ausgeben. Das mit der BOM ist nur wichtig, wenn die Unicode-(Nicht-ASCII-)Zeichen direkt im Quellcode stehen.
https://www.freebasic-portal.de/befehlsreferenz/wchr-143.html
https://www.freebasic.net/wiki/KeyPgWchr

Und dann unterstützt auch nicht jede Schriftart alle Unicode-Zeichen. Wie das mit der eingestellten Konsolenschriftart aussieht, musst du ausprobieren. (Allerdings sehe ich gerade, dass das im englischen Artikel dabeisteht.)
_________________
Deine Chance beträgt 1:1000. Also musst du folgendes tun: Vergiss die 1000 und konzentriere dich auf die 1.

Berkeley · Anmeldungsdatum: 13.05.2024 Beiträge: 91

BOM bringt schon mal null. Aber Microsoft überrascht mich auch nur seltenst positiv, obwohl ich nicht gerade die höchste Meinung von ihnen habe.

Ausgabe in UTF-16 funzt scheinbar. Microsoft kann schlicht kein UTF-8. Braucht also wieder mal nen Extracode... Zum Glück braucht's PRINT nur für ein paar Konsolenausgaben...

- Und was macht Linux ?

nemored · Anmeldungsdatum: 22.02.2007 Beiträge: 4699 Wohnort: ~/

Soweit ich weiß, setzt Unix/Linux schon seit etwa 30 Jahren voll auf UTF-8.

Was intern genau passiert, kann ich nicht sagen, aber das Programm

Berkeley · Anmeldungsdatum: 13.05.2024 Beiträge: 91

Ikes, wenn das stimmt, dann bestimmt der Compiler die richtige Codierung bei PRINT... Ich hab' die BOM an den Anfang meiner Strings gesetzt... Im Quelltext selbst benutz' ich eh praktisch nur ASCII, zumindest bei Releaseversionen.

Nachtrag, nach Tests: FbEdit kommt mit UTF-8 nicht klar, die BOM wird im Quelltext sichtbar ausgegeben. Beim Build kriegt der Compiler ein Problem mit Umlauten - weil FbEdit halt nicht auf UTF-8 kodiert, sondern offensichtlich ISO 8859. Unabhängig davon aber akzeptiert die Windowskonsole trotzdem kein UTF-8, dafür läuft sie auf ISO 8859, nicht mehr Codepage 850...

Grundsätzlich bin ich schon mal froh, wenn man sich drauf verlassen kann dass jede andere für mich relevante Zielplattform (Linux+Mac OS zwinkern

) UTF-8 verwendet.

nemored · Anmeldungsdatum: 22.02.2007 Beiträge: 4699 Wohnort: ~/

Ich verwende Geany und bin damit äußerst zufrieden - ist halt ein Universaleditor und keine IDE spezifisch für FreeBASIC. Aber Codierungsumstellungen sind damit absolut problemlos.

Der Compiler bestimmt nicht das Verhalten von PRINT (naja, eigentlich schon grinsen

), sondern die Interpretation des Stringinhalts. Die BOM gibt dem Compiler zu verstehen, dass Strings als Unicode aufzufassen sind, in der durch die BOM festgelegten Codierung.

Ansonsten ist der richtige Datentyp der WSTRING, der von der Windowskonsole dann auch korrekt übernommen werden müsste - natürlich wieder wenn die Nicht-ASCII-Zeichen korrekt im WSTRING gelandet sind. Intern arbeitet FreeBASIC dann mit UTF-16 oder UTF-32, je nach Betriebssystem.

Und ja, durchaus möglich, dass Windows nur UTF-16 kann und kein UTF-8. Unicode ist halt noch sehr neu. durchgeknallt

_________________
Deine Chance beträgt 1:1000. Also musst du folgendes tun: Vergiss die 1000 und konzentriere dich auf die 1.

grindstone · Verfasst am: 13.08.2024, 22:53 Titel:

Hallo!

Zu diesem Thema hatten wir vor einigen Jahren schon einmal einen Thread.
Vielleicht findest du da etwas, was dir weiterhilft.

Gruß
grindstone
_________________
For ein halbes Jahr wuste ich nich mahl wie man Proggramira schreibt. Jetzt bin ich einen!