ctrans.org

朧のヘルプ

  1. 動作環境・インストール・アンインストール
  2. とりあえず使ってみる
  3. 画面説明と基本的な使い方
  4. メニューの説明
  5. シェアウェア登録と辞書について
  6. フォントとIME
  7. 自分用の辞書を作る
  8. より便利に使うために
  9. サポート
動作環境・インストール・アンインストール

動作環境:Win2000で動作確認していますが、他バージョンのWindowsでも動作すると思います。

インストール:ダウンロードしたファイルをLZH形式に対応した解凍ソフトで解凍してください。oboro.exe、readme.txt、test.txt、oboro_dic.zipを含むフォルダが作成されると思います。これでインストールは完了です。oboro.exeをダブルクリックするとソフトが起動します。初回起動時は、中国語フォントを設定してください。おすすめフォントはSimsun、Mingliuです。中国語フォントがインストールされていないと、ファイル内容を正しく表示できないのでご注意下さい。

フォルダ名が日本語のフォルダに解凍、インストールしないで下さい。起動しません。また、Win2000/XPで使用する場合は、管理者権限でインストールしてください。

アンインストール:インストールの際に出来たフォルダを丸ごと削除してください。それでアンインストールは完了です。

目次に戻る
とりあえず使ってみる

起動したら画面左下の「現在の設定」を見て下さい。検索対象が「test.txt」、文字コードは「utf-8」、フォントは「system」になっていると思います(なってなかったら連絡下さい)。まずフォントを変更しましょう。画面左下「フォントとサイズ」と表示されているあたりをダブルクリックして下さい。フォントを変更するためのダイアログが出てきます。中国語を表示するためのフォント(推奨はSimsunかMingliu)とサイズを選んで、OKを押します。これで設定は完了です。早速検索してみます。IMEを中国語入力用に切り替えて、「検索語句」のところに適当な単語を入力します。入力できたらリターンを押すか、その下の「Search」ボタンをクリックします。しばらく待つと画面右側のエリアに辞書「test.txt」を検索した結果が表示されます。この辞書は簡易辞書で4000語くらいしか入っていませんので、入力した単語によっては何も表示されないかもしれません。めげずに単語を変えて何回か検索してみて下さい。なお、検索語句はピンインや日本語でも構いません。検索対象ファイルに含まれている語句なら何でも検索できます。つまり、これまでの辞書のように中日辞書、日中辞書を別々に用意する必要はありません。「単語データを辞書にかたっぱしから書き足してまとめて検索する」がoboroの正しい使い方です。

目次に戻る
画面の説明と基本的な使い方

上の画面が起動時のoboroです。番号順に画面の説明をします。

  1. 検索語句入力欄:ここに検索したい語句を入力します。入力後、下の「Search」ボタンを押すかリターンキーを押すと検索が実行されます。左下のチェック欄「正規表現で検索する」にチェックを入れると、正規表現が使用可能になります。正規表現については別途説明します。
  2. 検索履歴欄:過去に検索した語句を10件まで表示します。表示されている語句を選択してダブルクリックすると、上の「検索語句入力欄」にその単語が入力されます。
  3. 検索結果表示欄:ファイルを検索して、検索語句にマッチした内容が項目毎に表示され、検索語句に該当する箇所は強調表示されます。検索結果は検索するたびに更新されるため、この結果を保存したい場合は、ファイルメニューから「表示テキストを保存」を選択するか、保存した箇所をコピーして他アプリなどに貼り付けるなどして下さい。
  4. 設定表示欄:現在の設定内容を表示する欄です。各項目をダブルクリックすると、設定内容を変更することが出来ます。表示されている内容は以下の3項目です。
    検索対象ファイル:検索対象のファイル名が表示されます。ここをダブルクリックすると変更できますが、指定できるのはテキストファイル(拡張子がtxt)だけです。テキストファイルの文字コードはUnicode、UTF-8、GB2312、シフトJISが使用可能です。
    文字コード:検索対象ファイルの文字コードが表示されています。間違った文字コードを指定してしまった場合は、ここをダブルクリックすると変更できます。

    上述の通り、指定できる文字コードはUnicode、UTF-8、GB2312(表示はcp936)、シフトJIS(表示はcp932)の4種類です。要望があればBIG5の追加も検討します。
    フォントとサイズ:現在テキストの表示に使用しているフォント名とそのサイズが表示されます。変更したい場合は、ここをダブルクリックして下さい。フォント変更ダイアログが表示されます。

    ダイアログの表示に少しもたつきますが、仕様ですのでご了承下さい。なお、中国語表示が出来るフォントを選択しないと、ソフト側で無理矢理表示しようとするので見苦しくなります。推奨フォントはマイクロソフトが提供しているSimsunやMingliuです。これらのフォントは簡体字や繁体字だけでなく、あまり美しくないとはいえ日本語も表示できるので日中混在文書の内容を表示するのに最適です。フォントについてはこちらを参照下さい。

なお、初回起動時は付属の簡易中日辞書「test.txt」が検索対象に設定されています。フォントの設定が出来たら、このファイルを検索しながら色々試していただけると使い方がわかると思います。

目次に戻る
ファイルメニュー
  • 検索対象ファイル変更 … 検索対象にしているファイルを変更します。指定できるのはUnicode、UTF-8、GB2312、シフトJISのいずれかで記述されたテキストファイル(拡張子がtxt)だけです。なお、必要に応じて文字コードも変更して下さい。
  • フォント変更 … テキスト表示用フォントを変更します。フォントについてはこちらも参照して下さい。
  • 文字コード設定 … 検索対象ファイルの文字コードを指定します。正しい文字コードが選ばれていないと検索処理も正常に動作しませんので注意して下さい。
  • 検索対象ファイルの内容を確認 … 検索対象ファイルの内容を右側の表示欄に表示します。辞書ファイルを編集する際などにお使い下さい。
  • 表示テキストを保存 … 検索結果や検索対象ファイルの内容など、現在画面右側のテキストエリアに表示されているテキストをファイルに保存します。保存の際の文字コードは、現在の設定内容(画面左下で確認可)に基づきます。
  • 辞書ソート(重複削除) … 検索対象ファイル(辞書など)をソートします。本ソフトで使用する辞書ファイルは単純なテキストファイルですので、辞書を編集している内に単語が重複したり、語順がバラバラになるなど不都合が生じることがあります。この辞書ソート機能は、現在の検索対象ファイルの内容を改行を区切りとしてUnicode番号順に並び替え(昇順)、重複している行を削除します。
  • 編集メニュー

    コピー、切り取り、貼り付けです。テキスト編集用の基本的なコマンドなので説明は必要ないと思います。検索結果表示欄と検索語句入力欄で使用します。

    検索メニュー

    以下は検索を少し便利にするコマンド群です。的をしぼった検索を行いたい時は、正規表現が便利ですが、頻度が高い操作はここにまとめてあります。

    1. 前方一致 … oboroは検索の際、検索対象のファイルを一行ずつ読み込んで、その一行に検索語句が含まれているかどうかの判断を行い、含まれていたらその行を検索結果表示欄に表示するという処理をファイルの最後尾まで繰り返します。つまり、検索語句が現在検索中の行に含まれていれば、その含まれている場所は関係ありません。これはこれでOKなのですが、行の先頭にある単語だけを検索したい(特に辞書ファイルの検索時)こともあるでしょう。そういう時は、この「前方一致」を実行して下さい。正規表現を使用して(検索単語の先頭に^を加えます)、行の先頭にある単語のみ条件にマッチするようにします。なお、検索単語の先頭に^を加えて正規表現を使えば、同じ結果が得られます。
    2. 中国語完全一致 … このコマンドは本ソフトの推奨辞書形式を備えたファイルを検索対象にしている時に使用します(たとえば付属のtest.txtの検索時)。推奨辞書形式は「中国語 ピンイン 日本語訳(改行)」という風にテキスト一行の項目間をタブで区切ったものです。この形式のファイルを検索する際、単純な検索を行うと漢字一文字の単語などは関係ない単語のデータまでズラズラと表示されて検索結果が見にくくなります。中国語を検索しているのに、日本語訳部分にマッチすることも多々あります。これでは使いにくいので、本当に探している単語だけ表示できるようにするのが、この「中国語完全一致」です。正規表現を使用して、辞書ファイル各行の先頭にある、中国語のみを対照に検索を行います。
    3. 複数語句検索(or検索) … いくつかの単語をまとめて検索したい時に使用する機能です。各単語間を半角スペースで区切って検索語句入力欄に入力し、このコマンドを実行すると、それらの単語のいずれかに該当した箇所が検索結果表示欄に表示されます。コーパスを検索して類義語の用例を比較する際などに便利だと思います。
    4. フォルダから検索 … フォルダ内のテキストファイルをまとめて検索します。実行するとフォルダを選択するためのダイアログが表示されます。任意のフォルダを選択してください。検索の際に適用される文字コードは現在の文字コードになります(画面左下で確認して下さい)。GBやUnicodeなどを自動判別するような高度な機能はありませんので、正しい文字コードを指定してください。検索結果は「ファイル名:そのファイル内の行数 検索語句と一致した部分を含む行」の形式で表示されます。
    目次に戻る
    シェアウェア登録と辞書について

    インストール時に作られるoboro_dic.zipには、oboroで検索しやすいように編集した辞書ファイル「oboro_dic.txt」が収録されています。収録語数は約36000語で、私がこれまでに公開してきた「鵬」や「PDIC用の中国語辞書」といった辞書ファイルをもとに2000語ほど追加したものです。

    このファイルはシェアウェアで、解凍するにはパスワードが必要となります。test.txtでoboroの使い心地には満足したけど、収録語数が少なくて満足できない方は、ベクターシェアレジにてユーザー登録の上、パスワードを取得してください。料金は1000円です。取得したパスワードを入力することで、上記ファイルが解凍出来るようになります。

    ちなみにこのテキストファイルはUTF-8になっています。なお、「鵬」ユーザーの方は、追加料金を払う必要はありません。鵬のパスワードを使用してこのファイルを解凍することが出来ます。是非お試し下さい。

    ベクターの関連ページはこちら
    目次に戻る
    フォントとIMEについて

    中国語の文書を見るには中国語のフォントが必要です。お手持ちのパソコンの「Windows」フォルダにおける「FONT」フォルダに、Simsunというフォントがあればバッチリですが、該当しない方や設定方法を知らない方は、以下のリンクを参照してください。ちなみに本ソフトの推奨フォントはSimsunとMingliuです。これらのフォントは日中混在文書の表示に最適ですので、是非インストールして下さい。また、中国語を入力するにはIMEが必要です。これも下のリンクを参照すると入手方法などが書いてますので、インストールしておいた方がいいでしょう。

    エキサイトの中国語関連ヘルプ:http://www.excite.co.jp/world/help/chinese/
    目次に戻る
    自分用の辞書を作る

    本ソフトに付属している「test.txt」を開いてみましょう。「utf-8」という文字コードで記述してある日中混在文書なので、Unicodeに対応したEmEditorやC_Lexなどのエディタで閲覧するか、oboroのファイルメニューから「検索対象ファイルの内容を確認」を選んで、検索結果表示欄に表示するなどして下さい。MS-WORDなどでも開けます(この場合はフォントを適宜設定して下さい)。

    上はoboroでtest.txtを開いたところです。実際に開いてみるとわかりやすいですが、単語と発音、訳を半角スペース タブで区切って一行にまとめてあります。これが本ソフト推奨の辞書形式です。作成も楽ですし、検索結果を表示する際にタブ部分が改行に置換されて見やすくなるので、出来ればこの形式を使用して下さい。一行に含まれるのは単語と発音、訳が理想ですが、単語と訳だけでも構いませんし、単語と発音、訳に加えて例文や同義語、反義語を追加することも自由です。とにかく、タブで区切って、一行にまとめておけばそれでOKです。

    試しに次の一行をtest.txtの最終行に追加してみましょう。

    史努比	shi3nu3bi3	スヌーピー	[備考]アニメのキャラ
    

    追加出来たら保存します。oboroで編集している場合は、ファイルメニューの「表示テキストを保存」を実行して下さい。エディタやWordなどで編集している時は、上書き保存して下さい。

    それでは、編集した辞書ファイル「test.txt」を検索してみます。検索語句に「史努比」を入力し、検索を実行してみて下さい。検索結果に先ほど入力したデータが表示されていれば成功です。成功しない場合は、何か手順が抜けてるのかもしれません。もう一度上の手順を試して下さい。

    ここでは「test.txt」を編集しましたが、自分で辞書ファイルを作って、検索対象ファイルとして選択、検索することも出来ます。その場合も作り方は上述と同じですが、拡張子が「txt」で、文字コードはUnicodeやUTF-8、GBなどを使用して記述してある必要があります。検索対象に自作辞書を使う場合は、検索にかける時に文字コードが正しく選択されているかどうか確認して下さい。

    目次に戻る
    より便利に使うために

    1.テキスト検索に使用する。

    作者は日本語→中国語の翻訳をしている時に、動詞と目的語の組み合わせでよく頭を悩ませます。一般の辞書にも用例は載っていますが、いかんせん文例が少なく自分がとりあえず訳出した中国語が正しいのか確信が持てないのです。こういう時に役に立つのが中国語の文書を多数スクラップしたテキストファイルです。用例が知りたい単語を検索語句にして、このファイルの検索を行えば、自分の求める用法が見つかるかもしれないからです。

    それでは実際に検索してみましょう。まず、oboroの画面左下の「検索対象ファイル」をダブルクリックして、検索対象ファイルを切り替えます。小説や新聞記事など、どんなテキストファイルでもいいので中国語のファイルを選びます。この時、必要に応じて文字コードも変更することをお忘れなく。後は普通に検索するだけです。画面右側にズラズラっと用例が表示されると結構気持ちいいんですが、僕だけでしょうか。こうした用例検索で便利なのが複数語句の一括検索です。複数の類義語をいっぺんに検索して、用法の違いを調べる。普通の辞書ならページにしおりを挟んであっちやこっちを探し回らないといけない重労働が一瞬で終了します。ちなみに複数語句の検索は検索メニューの複数語句検索から行えます。もちろん正規表現を使って各単語間を|で区切っても結果は同じです。

    2.正規表現をかじってみる。

    単純な検索だけでも調べ物には十分ですが、検索結果にノイズが混じる時、つまり自分が探している単語と無関係の語句まで検出されると、その中から必要な情報を探し出すのはひと苦労です(特に単漢字の検索とか)。本ソフトの検索メニュー「前方一致」「中国語完全一致」「複数語句検索」を使用しても、多少は絞り込めますが、満足いく結果が得られるとは限りません。そういう時に便利なのが「正規表現」です。慣れるのに多少時間がかかりますが、覚えてしまえば検索効率が大幅にアップします。以下、正規表現で使用する記号の簡単な説明です。

    *…0文字以上の文字にマッチ
    +…1文字以上にマッチ
    ?…0または1文字にマッチ
    .…1文字にマッチ
    ^…行の先頭にマッチ。[]内で使うと否定になる。
    $…行の最後にマッチ
    []…括弧の文字にマッチ…[一-龠]などが使える
    など…部分パターンにマッチ
    …a,b等文字列にマッチ
    |…選択
    ()…部分パターン
    

    Wordなどで検索を行う時に、ワイルドカードを使って検索したことはあるなら、あのワイルドカードを強力にしたのが正規表現、と言う風に考えてください。そうすれば多少わかりやすいかもしれません。

    次に具体的な正規表現の使用例とマッチする内容を列挙します。

    我.的→「我家的、我們的、我真的」
    我.*的→「我所有的、我国人民的、我們公司職員的」
    安?静?→「安安静静、安静、安安静、安静静」
    安+静+→「安安静静」
    ^安静→行頭にある「安静」のみマッチ
    安静$→行末にある「安静」のみマッチ
    [安平鎮]静→「安静、平静、鎮静」
    [^安平]静→「沈静、鎮静」
    [一-龠]→全ての漢字にマッチ
    ([一-龠])→「匆匆、大大、走走」…部分パターンと前方参照。※このパターンをoboroに検索させるとかなり時間がかかります。
    我們|他們→「我們、他們」
    (我們|他們)(想像|做法)→「我們想像、我們做法、他們想像、他們做法」
    

    なお、正しくない正規表現を入力するとエラーが出ます。

    目次に戻る
    サポート

    バージョンアップなどに関しては以下のサイトでアナウンスします。不具合などは、作者タケウチにメールをいただけければ、能力の許す限り対応します。なお、このソフトを使用してトラブルが発生しても、作者はいっさい関知いたしません。使用は自己責任でお願いいたします。

    MAIL:ctrans@gmail.com

    目次に戻る