Het verwerken van Pinyin en Chinese karakters op de computer
- Het invoeren van karakters in documenten
- Het invoeren van Pinyin tekens in documenten
- Webpagina's lezen
- Webpagina's maken
- Links
- Terminologie
Het invoeren van karakters in documenten
De gratis Input Method Editor is in een Windows-omgeving in mijn ogen verreweg de simpelste en plezierigste manier om Chinese tekst in te voeren. Ik heb daar een aparte pagina aan gewijd.
Als je niet bang bent om veel te klikken en tussen vensters heen en weer te schakelen kan je ook gebruik maken van de Character Map (standaard aanwezig in Windows).
M.b.v. de Character Map moet je karakter voor karakter in je document plakken. Het grote voordeel van de IME is dat hij karakters aanpast afhankelijk van de context. Als je bv. nĭ hăo intikt in de IME, weet hij precies welke 'ni' en welke 'hao' het meest waarschijnlijk zijn (nĭhăo is een veelgebruikte groet in het Chinees).
Een recente nieuwe mogelijkheid is het gebruiken maken van een
(Engelstalige) website.
Op de MDBG site
kan je niet alleen woorden opzoeken van Engels naar Chinees en omgekeerd,
maar ook karakters of Pinyin invoeren.
Voor karakters klik je op Type Chinese in het
menu aan de linkerkant.
Character map (Speciale tekens)
Start de Character Map (Speciale tekens) via
Start - Programs (Programma's) - Accessories
(Bureau-accessoires) - System Tools (Systeemwerkset).
Klik op Advanced view (Geavanceerde weergave).
Je kan nu in het vak 'Group by' (Groeperen op) kiezen voor 'Simplified Chinese by PinYin'. Door bv. de 'd' in te tikken krijg je dan alle karakters voor 'da', 'dai', 'dan', etc. in groepen te zien.
Vervolgens klik je op het gewenste karakter, dan op Select
(Selecteren), dan op Copy (Kopiëren) en
tenslotte plak je het karakter in het document.
Het invoeren van Pinyin tekens in documenten
Inleiding
Een eenvoudige manier om Pinyin te produceren (in mail, tekstverwerker)
is het installeren van een Pinyin font.
Een voorbeeld is cpinyin0.ttf.
Een font kan je het gemakkelijkste installeren via
Start - Instellingen (Settings) -
Configuratiescherm (Control Panel) - Lettertypen (Fonts) -
Bestand (File) - Nieuw lettertype installeren (Install New Font)
.
Je kan dan aangeven op welke plek je de font file hebt staan.
Vanaf dat moment kan je in elk programma het Pinyin font kiezen net als je
andere fonts zou kiezen.
In Wordpad doe je bv. Opmaak (Format) -
Lettertype (Font).
Er verschijnt dan een lijst met fonts.
Het font cpinyin0.ttf heeft
de naam Chinese Pinyin.
Een recente nieuwe mogelijkheid is het gebruiken maken van een
(Engelstalige) website.
Op de MDBG site
kan je niet alleen woorden opzoeken van Engels naar Chinees en omgekeerd,
maar ook karakters of Pinyin invoeren.
Voor Pinyin klik je op Type Pīnyīn in het
menu aan de linkerkant.
Toetsen
De toetsen waaronder de Pinyin tekens zitten:
| ā: ` (linksboven) | á: 1 | ă: 2 | à: 3 |
| ē: 4 | é: 5 | ĕ: 6 | è: 7 |
| ī: % | í: ^ | ĭ: & | ì: * |
| ō: 8 | ó: 9 | ǒ: 0 | ò: - |
| ū: [ | ú: { | ǔ: } | ù: ] |
| ǖ: = | ǘ: + | ǚ: | | ǜ: \ (rechtsmidden) |
| Ā: ~ | Á: ! | Ă: @ | À: # |
| Ē: $ |
Webpagina's lezen
Plaatjes versus codes
Op enkele webpagina's zijn (een deel van de) karakters als plaatjes (net als foto's) weergegeven. Om die karakters te kunnen zien hoef je niets bijzonders te doen. In onderstaande ga ik er van uit dat voor elk karakter een bepaalde code is gebruikt. Deze situatie komt verreweg het meeste voor.
Minimale vereiste
In de meeste gevallen zal het voldoende zijn om bestanden voor Oost-Aziatische talen te installeren. Hoe dat bv. voor Windows XP moet staat op mijn pagina over IME
Character set/encoding (tekenset)
In waarschijnlijk vrij zeldzame gevallen moet je gaan sleutelen aan de character set (character encoding).
- wat heeft de auteur van de webpagina opgegeven als te gebruiken 'character set' (in dit geval wordt met character niet Chinees karakter bedoeld, maar gewoon een weer te geven teken). Dit kan je vanzelfsprekend niet zelf beïnvloeden.
- wat staat er in je browser ingesteld als default 'character encoding'.
Wat je zelf in je browser kunt instellen hangt waarschijnlijk af van
wat je vooraf hebt gedaan in het onderdeel (Windows XP en hoger)
Regional and Language Options (Landinstellingen)
van
Control Panel (Configuratiescherm).
Firefox
Character encoding instellen
Klik op Tools (Extra) - Options (Opties) - Content
(Inhoud) - Advanced (Geavanceerd) (in het vak
Fonts & Colours (Lettertypen en kleuren).
Maak een keuze
in het onderste vak (Character Encoding (Standaard
tekenset)).
Op dit moment heb ik als Character encoding
Unicode (UTF-8) ingesteld
(Firefox 3.5), maar ik heb het gevoel dat het niet veel
invloed heeft op of ik Chinese text al dan niet kan lezen.
Firefox View menu
Ga naar View (Beeld) - Character Encoding (Tekenset). Onder de separator (scheidingsbalk) staat een lijst met beschikbare encodings. Normaal zal daar 'Western (ISO-8859-1)' (Westers (ISO-8859-1)) geselecteerd zijn. Voor veel pagina's met Chinese tekens heb je echter 'Chinese Simplified (GB2312)' (Vereenvoudigd Chinees (GB2312)) of 'Chinese Traditional (Big5)' (Traditioneel Chinees (Big5)) nodig. De laatste 2 kun je toevoegen aan de lijst via View (Beeld) - Character Encoding (Tekenset) - More Encodings (Meer) - East Asian (Oost-Aziatisch). Als je dan in plaats van Western (Westers) 1 van de Chinese alternatieve kiest zou je de meeste webpagina's moeten kunnen lezen.
In het forum Chinese coding systems staat een onderwerp 'Unicode test'.
Webpagina's maken
Pinyin
Met de volgende HTML codes produceer je de klinkers met de verschillende tonen:
| ā: ā | á: á | ǎ: ǎ | à: à |
| ē: ē | é: é | ě: ě | è: è |
| ī: ī | í: í | ǐ: ǐ | ì: ì |
| ō: ō | ó: ó | ǒ: ǒ | ò: ò |
| ū: ū | ú: ú | ǔ: ǔ | ù: ù |
| ǖ: ǖ | ǘ: ǘ | ǚ: ǚ | ǜ: ǜ |
En voor de hoofdletters:
| Ā: Ā | Á: Á | Ǎ: Ǎ | À: À |
| Ē: Ē | É: É | Ě: Ě | È: È |
| Ī: Ī | Í: Í | Ǐ: Ǐ | Ì: Ì |
| Ō: Ō | Ó: Ó | Ǒ: Ǒ | Ò: Ò |
| Ū: Ū | Ú: Ú | Ǔ: Ǔ | Ù: Ù |
| Ǖ: Ǖ | Ǘ: Ǘ | Ǚ: Ǚ | Ǜ: Ǜ |
Vanzelfsprekend is het geen lolletje om al die ingewikkelde codes met de hand te moeten invoeren. Ik kan op dit moment maar 2 oplossingen bedenken:
- maak gebruik van een of ander macro-systeem, bv. dat je m.b.v.
Alt+F2de à produceert; - zet in webpagina à als je à wilt weergeven, é als je é wilt weergeven, etc. Schrijf in een of andere programmeertaal een programma om op alle pagina's van je site à om te zetten in de code voor à, etc.
Ik heb gekozen voor de laatste oplossing, nl. met een programma in Perl. Perl is een gratis programmeertaal, maar niet de meest gebruikersvriendelijke.
Karakters op webpagina's maken
PSPad
Ik gebruik voor het maken van webpagina's een simpele editor (PSPad), en daarin kan je gewoon met de IME karakters produceren. Je moet wel 1 van de meest recente versies van PSPad gebruiken (4.5.3 is voldoende).
Binnen PSPad moet je mogelijk wel een aantal instellingen veranderen.
(Op mijn huidige PC hoeft het niet, misschien omdat ik in de webpagina
als character set utf-8 heb opgegeven?!)
In het dialoogvenster dat je krijgt na
Format - Font had ik op mijn vorige PC bij
Font 'nSimSun' staan, en bij
Script 'CHINESE_GB2312' (dit staat
voor de vereenvoudigde Chinese karakters).
Links
Forums waar je technische vragen kunt stellen
- Geledraak Forum over China, Hong Kong en Taiwan
- Prikbord van chinesetaal.prikpagina.nl
- Questions about Reading Chinese Codes forum van China the Beautiful website
- Chinese coding systems, Sound and other technical problems forum van China the Beautiful website
Terminologie
- Pinyin
- Een van de systemen om Chinees alfabetisch weer te geven (het meest moderne en door de Chinese regering aanbevolen).
Reageer via E-mail (dalmolen@xs4all.nl)
Deze pagina is voor het laatst gewijzigd op: 9-11-2009 20:06:47