音で引くタイ語辞書の作り方(2)

このエントリーをはてなブックマークに追加 はてなブックマーク

音で引くタイ日実用辞典をPCで作ってみよう!

前回は岡滋訓氏の「音で引くタイ日実用辞典」の有用性を説明しました。
今回はいよいよPC版「音で引く日タイ日実用辞典」の作成のお話です。

前回、日本初だとか大げさなことを書いてちょっと誇大宣伝をしてしまいましたが、辞書ソフトを作るといっても、 私が実際にタイ語辞書ソフトを作成して何万語もタイ語を登録するわけにもいかないので、既存のタイ語辞書ソフトを流用します。

こちらのページで説明した「PDICタイ語」です。
残念ながら白石昇氏の辞書ファイルには発音記号が登録されていないので、変換が大変です。
音で引くタイ語辞典を作るのに、最も簡単な方法は、すでに存在する発音記号をルールに則って、変換してやるのが一番だからです。

従ってここではオリジナルのPDICタイ語に登録されている辞書ファイルを変換してやることにします。
タイリンが作成したのは、その為の変換ツールというわけです。

ところで、どうでも良いことですが、このツールの名前を付けます。今考えました。
「音で引くタイ日実用辞典作成ツール」だとか、「音で引くタイ語辞書変換ソフト」だとか、覚えにくいのでツールの名前はこんな感じにします。

  • 音リンガルコンバーター

さて、名前が決まったところで、早速このページからダウンロードしてください。

残念なことに、手元にあったVisual Studio2008で手軽に作ってしまったので、音リンガルコンバーターを動かすには「.netframework」のインストールが必要になっていると思います。

「.netframework」はこの辺からダウンロードしてください。
「Microsoft .NET Framework 3.5 再頒布可能パッケージ」 で良いと思います。

作成手順

音リンガルコンバーターが起動できる準備が整ったところで、全体の辞書作成手順を説明します。

(*注)この記事を書いた後にPDIC Unicode正式版がリリースされました。 しかし、正式版では現状うまくCSVコンバート出来ない様なので、以下の処理は旧版PDIC/Unicode Ver0.70でお試しください。

  1. PDICを立ち上げる
  2. PDICの辞書変換機能を使って、PDIC形式(.dic)の辞書ファイルをCSV形式(.csv)の辞書ファイルとして出力する
  3. 音リンガルコンバーターを起動し、2で出力したCSV形式の辞書ファイルを指定し、変換処理を施す。→音で引く為の辞書ファイルがCSV形式で出力される
  4. PDICの辞書変換機能を使って、2とは逆に3で作成したCSV形式(.csv)の辞書ファイルをPDIC形式(.dic)の辞書ファイルに変換してやる。
  5. 4で変換されたPDIC形式(.dic)の辞書ファイルをPDICの辞書グループに登録する

こんな感じで処理していきます。
なぜ、 PDIC形式(.dic)の辞書ファイルをそのまま音リンガルコンバーターで処理しないかというと、CSV形式(.csv)の方が処理が簡単だからです。ちょっと面倒かもしれませんが、ガマンして下さい。

以下、手順の1~5を順に説明していきます。
尚、PDICがまだ入ってない方は、こちらのページを参考にしてPDICをインストールしておいてください。

1.PDICを立ち上げる

  →立ち上げてください。

2. PDICの辞書変換機能を使って、PDIC形式(.dic)の辞書ファイルをCSV形式(.csv)の辞書ファイルとして出力する

「Tools」->「辞書の変換」を選びます。

転送元辞書のファイル形式を「PDIC形式」、転送先辞書のファイル形式を「CSV形式」にしてください。
そして、転送元辞書の「参照ボタン」をクリックします。

PDICタイ語からダウンロードしてきた、辞書ファイルを選択してください。
通常は「C:\Program Files\Personal Dictionary (Unicode)」フォルダあたりに入っているはずです。
また、PDICタイ語の辞書ファイルには、無料版と有料版があります。
下の写真は有料版の辞書ファイル(Uni-PdicThai-039b.dic)です。
ファイルを選択して「開く」をクリックします。

同様に、転送先辞書ファイルも、「参照」ボタンをクリックしてファイルを指定します。
こちらは既存のファイルでなく、「ファイル名」欄に新規にファイル名を入れます。
名前は何でもよいのですが、ここでは仮に「oto.csv」としました。
「開く」ボタンをクリックします。

これで、CSV形式で辞書ファイルの出力準備が整ったので、「辞書の変換」画面で「OK」をクリックします。
下の画面の様に、変換中画面が出ます。

変換が完了します。
私の使っているPDICタイ語(有料版)には、4万7千件くらいの用語が登録されていたようです。

続いて、

3.音リンガルコンバーターを起動し、2で出力したCSV形式の辞書ファイルを指定し、変換処理を施す。→音で引く為の辞書ファイルがCSV形式で出力される

を説明します。

音リンガルコンバーターを起動してください。
シンプルな画面です。
「変換元辞書ファイルを選択」ボタンをクリックします。

ファイル選択画面が立ち上がります。
2.で作成したCSV形式の辞書ファイルを選択します。
(ここでは、「oto.csv」)
「開く」ボタンをクリックします。

続いて「変換後出力辞書ファイルを選択」ボタンをクリックします。
下のような画面が立ち上がります。
ここでは、既存ファイルではなく、新規で作成するファイル名を「ファイル名」欄に入力します。
ファイル名は何でも良いのですが、ここでは仮に「oto_out.csv」とします。

変換準備が整ったので「変換」ボタンをクリックします。
この変換処理は大変時間がかかります。
私のPCではCPUが100%になった状態で1分以上かかりました。
CPUが100%にならない人はメモリーが足りていない可能性があります。
メモリーが足りないと仮想メモリーを使用することになるため、大変時間がかかります。
「変換」前に、他のプログラムを閉じておくことをお勧めします。

変換中の画面です。
変換中の単語数が表示されます。
時々固まったように見えるかもしれませんが、実際には動いています。

処理が完了します。

これで、音リンガルコンバーターの役目は終わりました。

続いて

4.PDICの辞書変換機能を使って、2とは逆に3で作成したCSV形式(.csv)の辞書ファイルをPDIC形式(.dic)の辞書ファイルに変換してやる。

を説明します。

2.と同様にPDICを立ち上げて
「Tools」->「辞書の変換」
を選択してください。

今度は2と逆に

 ・転送元辞書に「CSV形式」
・転送先辞書に「PDIC形式」

を選択してください。
その上で転送元辞書の「参照」ボタンをクリックします。

ファイル選択画面が立ち上がるので
3.で作成したCSV形式の辞書ファイル(ここでは「oto_out.csv」)を選択して「開く」をクリックします。

続いて辞書の変換画面で転送先辞書の「参照」ボタンをクリックします。
ここでは、既存ファイル名ではなく、「ファイル名」欄に新規のファイル名を入力します。
ここでは仮に「Uni-PdicThai-039b-oto.dic」としました。
「開く」ボタンをクリックします。

これで、変換準備が整いました。
辞書の変換画面で「OK」ボタンをクリックします。
処理を続けていくと下のような画面が出てくると思います。
「以降自動処理」をクリックします。

処理が完了しました。
約14万件が登録されました。
元が4万7千件だったので、3倍に単語数が増えたことになります。

これで、PDIC形式の辞書ファイルが作成されました。

続いて

5.4で変換されたPDIC形式(.dic)の辞書ファイルをPDICの辞書グループに登録する

を説明します。


「File」->「辞書グループ編集」を選択します。

現在登録されている辞書ファイル一覧が表示されます。
ここに先ほど作成した辞書ファイルを追加してやります。
画面下の方にある「辞書追加」ボタンをクリックします。

4で作成したPDIC形式(.dic)の辞書ファイルを選択します。
(ここではUni-PdicThai-039b-oto.dic)
「開く」ボタンをクリック

使用辞書の中に今追加した辞書ファイルが入っていることを確認できます。
「OK」ボタンをクリックして完了です。
作成したCSVファイル(ここでは「oto.csv」「oto_out.csv」)は不要なので削除してかまいません。

試しにちょっと使ってみましょう。
水浴びをする「アープナーム」を検索します。

  • apnam

と入れてみてください。
下のようにヒットすれば成功です。(anamでもヒットします)

「音で引くタイ語辞書」のルールについて

・・・書こうかと思いましたが、疲れたので、ブログの説明を参照してください。
実際の使用画面で具体例を挙げているのでわかると思います。



コメント

「PDICタイ語の辞書ファイル」を「旧版PDIC/Unicode Ver0.70」でcsvに変換ができません・・・。
何度もチャレンジしているのですが、パソコン初心者には無理でしょうか?
でも、こちらでお勧めしているPersonal Dictionary等はパソコンにもiphoneにも何とか導入でき助かっています。

| K | 2011-01-25 00:00:00 |

csvに変換できないとのことですが、何かエラーは表示されていますか?
なぜか理由はわかりませんがPCの環境によっては最初にcsvを作ろうとしたときに、csvが読みとり専用になってしまうことがあるようです。
その場合はcsvを右クリックしてプロパティ画面を開いてから「読みとり専用」のチェックを外してやってから追記してやるとうまくいくことがあるみたいです。

| タイリン | 2011-01-25 00:00:00 |

チェックは付いていないのですが、読み取りができないようです。「Ver.5.4.X」でも辞書変換をしてみましたが、無理なようです。検索して別のソフトでcsvにしてから音リンガルで変換しようと思います。パソコン初心者で尋ね方もよく解りませんのでご迷惑をお掛けしました。

| K | 2011-01-26 00:00:00 |

成功しました。
タイリンさんのブログをチェックすると「PDIC/Unicode 正式版って・・・?」というタイトルのところに詳しく説明がありました。
丸2日かかりましたが、タイ文字を覚えた時のような達成感です。ありがとうございました。

| K | 2011-01-26 00:00:00 |

成功したみたいで良かったです。
どんな記事だったか全然おぼえてないのですがw

| タイリン | 2011-01-26 00:00:00 |

タイリンさんのブログの「PDIC/Unicode 正式版って・・・?」という記事を参考にしたのですが、PDIC/Unicode の古いバージョンを入れているにも関わらず、結局できませんでした><
PCにそこそこ詳しい夫にも見て貰ったのですが、やはり出来ず、一番最初のファイル変換のところで、dic.ファイルの変換のところでエラーが出てつまづいてしまいます。
Windows7でやっています。もう少し、詳しい最新の情報を体系的に載せていただけると、できると思うのですが、お時間ありましたら、とてもよいソフトだと思うので、ぜひお願いいたします!

辞書ツールに奮闘するよりも、自分で単語何個か覚える方が先かしら、とも思っています。とにかくPCは得意ではないのですが、タイ語を学ぶ意欲はあります!

| たま | 2011-06-21 18:18:00 |

タイ語初めて二週間のおじいさんです。初心者には打って付けのソフトです。是非利用させて頂きたいのですが、PDIC/Unicode Version7.0 でダウンロードしたUni-PdicThai-IPA-FR-069U.dicをcsvファイルに変換しようと何度もトライしてますがPDICとして認識されず変換開始されません。Win7環境です。何か方策考えられませんでしょうか。

| しげ | 2014-08-20 07:31:34 |

コメントを書く:
名前:
コメント:


人気ホテル予約ランキング(バンコク)
1位 プリンス パレス ホテル
プリンス パレス ホテルコストパフォーマンスを求めるならここ☆ お得感たっぷり。
2位 バイヨーク スカイ ホテル
バイヨーク スカイ ホテル市場と夜景を楽しみたい人に♪ 朝食も種類が豊富で人気
3位 グランデセンターポイントスクンビット ターミナル21
グランデセンターポイントスクンビット ターミナル21アソークエリアにオープンしたばかりの大型商業施設「ターミナル21」にある最新サービスアパート。キッチン・洗濯機・トイレにはウォシュレットを完備。
4位 ナサベガスホテル
ナサベガスホテル
5位 ルブアアットステイトタワーホテル
ルブアアットステイトタワーホテルおもてなしも5つ星クラス 屋上の屋外レストラン&バーSirocco は経験する価値大!
人気ホテル予約ランキング(パタヤ)
1位 ロイヤルクリフホテルズグループ
ロイヤルクリフホテルズグループ
2位 リド ビーチ ホテル
リド ビーチ ホテル
3位 アット マインド サービス レジデンス
アット マインド サービス レジデンス
4位 ベイウォーク レジデンス
ベイウォーク レジデンス
5位 ヒルトン パタヤ
ヒルトン パタヤ
タイの観光地をタイ語で
アユタヤ:อยุธยา
王宮:พระบรมมหาราชวัง
王宮前広場:สนามหลวง
カオサン通り:ถนนข้าวสาร
カオヤイ国立公園:เขาใหญ่
カンチャナブリ:กาญจนบุรี
クラビ:กระบี่
国立博物館:พิพิธภัณฑสถานแท่งชาติ
サファリワールド:ซาฟารีเวิลด์
サムイ島:เกาะสมุย
サメット島:เกาะเสม็ด
サヤーム:スクエアー:สยามสแควร์
サンペーンレーン:ซอยสำเพ็ง
ジム・トンプソンの家:บ้านจิมทอมสัน
スアン・サヤーム:สวนสยาม
スクンビット:สุขุมวิท
スコータイ:สุโขทัย
スネーク・ファーム:สวนงู
スワンナプーム国際空港:สนามบินสุวรรณภูมิ
タニヤ:ธนิยะ
ダムヌン・サドゥアク水上マーケット:ตลาดน้ำดำเนินสะดวก
チャーン島:เกาะช้าง
チャトゥチャック市場:ตลาดนัดจตุจักร
チェンマイ:เชียงใหม่
チェンライ:เชียงราย
ドゥシット動物園:สวนสัตว์ดุสิต
ドイステープ:ดอยสุเทพ
パーククローン市場:ตลาดปากคลอง
ハジャイ:หาดใหญ่
パタヤ:พัทยา
パッポン:พัฒน์พงษ์
バンコク:กรุงเทพฯ
バンランプー市場:ตลาดบางลำภู
ピーピー島:เกาะพีพี
ピマイ:พิมาย
プーケット島:เกาะภูเก็ต
プラトゥーナーム:ประตูน้ำ
民主記念塔:อนุสาวรีย์ประชาธิปไตย
ミンブリー:มีนบุรี
ヤワラー通り:ถนนเยาวราช
ラン島:เกาะลาน
ルンピニー公園:สวนลุมพินี
ワット・アルン:วัดอรุณ
ワット:トライミット:วัดไตรมิตร
ワット・プラケオ:วัดพระแก้ว
ワット・ポー:วัดโพธิ์
最近のコメント
「OsaKa2020.. by ロレックススーパーコピー
「OsaKa2020.. by ロレックススーパーコピー時計
ブランドコピーsho.. by ブランドコピーshopkopi.com
ブランドスーパーコピ.. by ブランドスーパーコピー!
はじめまして タイ.. by 名無しのタイリン
タイ人でも使用しない.. by 名無しのタイリン
この度は本当に有り難.. by シャネルコピー
何度か、問い合わせを.. by ルイヴィトンコピー
早くフォントの対応一.. by 名無しのタイリン
スーパーコピーブラン.. by スーパーコピー
ルブア アット ステイト タワー ホテル

相互リンク募集中

Copyright (C) 2007-2012 Thailingual. All Rights Reserved.