KB » Chinees » Chinese tekens op de computer

Het verwerken van Pinyin en Chinese karakters op de computer


Het invoeren van karakters in documenten

De gratis Input Method Editor is in een Windows-omgeving in mijn ogen verreweg de simpelste en plezierigste manier om Chinese tekst in te voeren. Ik heb daar een aparte pagina aan gewijd.

Als je niet bang bent om veel te klikken en tussen vensters heen en weer te schakelen kan je ook gebruik maken van de Character Map (standaard aanwezig in Windows).

M.b.v. de Character Map moet je karakter voor karakter in je document plakken. Het grote voordeel van de IME is dat hij karakters aanpast afhankelijk van de context. Als je bv. nĭ hăo intikt in de IME, weet hij precies welke 'ni' en welke 'hao' het meest waarschijnlijk zijn (nĭhăo is een veelgebruikte groet in het Chinees).

Een recente nieuwe mogelijkheid is het gebruiken maken van een (Engelstalige) website. Op de MDBG site kan je niet alleen woorden opzoeken van Engels naar Chinees en omgekeerd, maar ook karakters of Pinyin invoeren. Voor karakters klik je op Type Chinese in het menu aan de linkerkant.

Character map (Speciale tekens)

Start de Character Map (Speciale tekens) via Start - Programs (Programma's) - Accessories (Bureau-accessoires) - System Tools (Systeemwerkset).

Klik op Advanced view (Geavanceerde weergave).

Je kan nu in het vak 'Group by' (Groeperen op) kiezen voor 'Simplified Chinese by PinYin'. Door bv. de 'd' in te tikken krijg je dan alle karakters voor 'da', 'dai', 'dan', etc. in groepen te zien.

Vervolgens klik je op het gewenste karakter, dan op Select (Selecteren), dan op Copy (Kopiëren) en tenslotte plak je het karakter in het document.


Het invoeren van Pinyin tekens in documenten

Inleiding

Een eenvoudige manier om Pinyin te produceren (in mail, tekstverwerker) is het installeren van een Pinyin font. Een voorbeeld is cpinyin0.ttf.

Een font kan je het gemakkelijkste installeren via Start - Instellingen (Settings) - Configuratiescherm (Control Panel) - Lettertypen (Fonts) - Bestand (File) - Nieuw lettertype installeren (Install New Font) . Je kan dan aangeven op welke plek je de font file hebt staan.

Vanaf dat moment kan je in elk programma het Pinyin font kiezen net als je andere fonts zou kiezen. In Wordpad doe je bv. Opmaak (Format) - Lettertype (Font). Er verschijnt dan een lijst met fonts. Het font cpinyin0.ttf heeft de naam Chinese Pinyin.

Een recente nieuwe mogelijkheid is het gebruiken maken van een (Engelstalige) website. Op de MDBG site kan je niet alleen woorden opzoeken van Engels naar Chinees en omgekeerd, maar ook karakters of Pinyin invoeren. Voor Pinyin klik je op Type Pīnyīn in het menu aan de linkerkant.

Toetsen

De toetsen waaronder de Pinyin tekens zitten:

ā: ` (linksboven) á: 1 ă: 2 à: 3
ē: 4 é: 5 ĕ: 6 è: 7
ī: % í: ^ ĭ: & ì: *
ō: 8 ó: 9 ǒ: 0 ò: -
ū: [ ú: { ǔ: } ù: ]
ǖ: = ǘ: + ǚ: | ǜ: \ (rechtsmidden)
Ā: ~ Á: ! Ă: @ À: #
Ē: $

Webpagina's lezen

Plaatjes versus codes

Op enkele webpagina's zijn (een deel van de) karakters als plaatjes (net als foto's) weergegeven. Om die karakters te kunnen zien hoef je niets bijzonders te doen. In onderstaande ga ik er van uit dat voor elk karakter een bepaalde code is gebruikt. Deze situatie komt verreweg het meeste voor.

Minimale vereiste

In de meeste gevallen zal het voldoende zijn om bestanden voor Oost-Aziatische talen te installeren. Hoe dat bv. voor Windows XP moet staat op mijn pagina over IME

Character set/encoding (tekenset)

In waarschijnlijk vrij zeldzame gevallen moet je gaan sleutelen aan de character set (character encoding).

Wat je zelf in je browser kunt instellen hangt waarschijnlijk af van wat je vooraf hebt gedaan in het onderdeel (Windows XP en hoger) Regional and Language Options (Landinstellingen) van Control Panel (Configuratiescherm).

Firefox

Character encoding instellen

Klik op Tools (Extra) - Options (Opties) - Content (Inhoud) - Advanced (Geavanceerd) (in het vak Fonts & Colours (Lettertypen en kleuren). Maak een keuze in het onderste vak (Character Encoding (Standaard tekenset)).

Op dit moment heb ik als Character encoding Unicode (UTF-8) ingesteld (Firefox 3.5), maar ik heb het gevoel dat het niet veel invloed heeft op of ik Chinese text al dan niet kan lezen.

Firefox View menu

Ga naar View (Beeld) - Character Encoding (Tekenset). Onder de separator (scheidingsbalk) staat een lijst met beschikbare encodings. Normaal zal daar 'Western (ISO-8859-1)' (Westers (ISO-8859-1)) geselecteerd zijn. Voor veel pagina's met Chinese tekens heb je echter 'Chinese Simplified (GB2312)' (Vereenvoudigd Chinees (GB2312)) of 'Chinese Traditional (Big5)' (Traditioneel Chinees (Big5)) nodig. De laatste 2 kun je toevoegen aan de lijst via View (Beeld) - Character Encoding (Tekenset) - More Encodings (Meer) - East Asian (Oost-Aziatisch). Als je dan in plaats van Western (Westers) 1 van de Chinese alternatieve kiest zou je de meeste webpagina's moeten kunnen lezen.

In het forum Chinese coding systems staat een onderwerp 'Unicode test'.


Webpagina's maken

Pinyin

Met de volgende HTML codes produceer je de klinkers met de verschillende tonen:

ā: ā á: á ǎ: ǎ à: à
ē: ē é: é ě: ě è: è
ī: ī í: í ǐ: ǐ ì: ì
ō: ō ó: ó ǒ: ǒ ò: ò
ū: ū ú: ú ǔ: ǔ ù: ù
ǖ: ǖ ǘ: ǘ ǚ: ǚ ǜ: ǜ

En voor de hoofdletters:

Ā: Ā Á: Á Ǎ: Ǎ À: À
Ē: Ē É: É Ě: Ě È: È
Ī: Ī Í: Í Ǐ: Ǐ Ì: Ì
Ō: Ō Ó: Ó Ǒ: Ǒ Ò: Ò
Ū: Ū Ú: Ú Ǔ: Ǔ Ù: Ù
Ǖ: Ǖ Ǘ: Ǘ Ǚ: Ǚ Ǜ: Ǜ

Vanzelfsprekend is het geen lolletje om al die ingewikkelde codes met de hand te moeten invoeren. Ik kan op dit moment maar 2 oplossingen bedenken:

  1. maak gebruik van een of ander macro-systeem, bv. dat je m.b.v. Alt+F2 de à produceert;
  2. zet in webpagina à als je à wilt weergeven, é als je é wilt weergeven, etc. Schrijf in een of andere programmeertaal een programma om op alle pagina's van je site à om te zetten in de code voor à, etc.

Ik heb gekozen voor de laatste oplossing, nl. met een programma in Perl. Perl is een gratis programmeertaal, maar niet de meest gebruikersvriendelijke.

Karakters op webpagina's maken

PSPad

Ik gebruik voor het maken van webpagina's een simpele editor (PSPad), en daarin kan je gewoon met de IME karakters produceren. Je moet wel 1 van de meest recente versies van PSPad gebruiken (4.5.3 is voldoende).

Binnen PSPad moet je mogelijk wel een aantal instellingen veranderen. (Op mijn huidige PC hoeft het niet, misschien omdat ik in de webpagina als character set utf-8 heb opgegeven?!) In het dialoogvenster dat je krijgt na Format - Font had ik op mijn vorige PC bij Font 'nSimSun' staan, en bij Script 'CHINESE_GB2312' (dit staat voor de vereenvoudigde Chinese karakters).


Forums waar je technische vragen kunt stellen


Terminologie

Pinyin
Een van de systemen om Chinees alfabetisch weer te geven (het meest moderne en door de Chinese regering aanbevolen).

© Henk Dalmolen
Reageer via E-mail (dalmolen@xs4all.nl)

Deze pagina is voor het laatst gewijzigd op: 9-11-2009 20:06:47