ctrans.org

Unihan.txtをエクセルで

Unihan DatabaseをMicrosoft Excelで閲覧できるように整形しました。収録しているデータの範囲は、U+3400からU+FAD9までとなります。フィールド名は、UAX #38: Unicode Han Database (Unihan)で説明されている通りですが、1列目に漢字を追加してあります。

ダウンロード:UnihanXls.zip (5.96MB)

ライセンス:Unihan Databaseのライセンスに準じます。

2008-07-23 14:41:10
permalink | Chinese

Full Screen Editor - Wu

wuWu はフルスクリーンエディタです。WriteroomDark Roomのように集中して文章を書くための環境を提供します。起動すると黒い画面にカーソルだけが浮かび、文章を書く以外のことができなくなります。

Wu is a full screen editor that offers a distraction-free writing environment such as Writeroom or Dark Room. Only black screen and a cursor are shown when starting Wu. All you can do is to write text.

wuDownLoad: wu.zip (1.59MB)

Source: wu.vfs.zip ( Tcl/Tk 8.5 )

注意:フルスクリーンエディタですので、「閉じる」ボタンなども表示されません。Wu を終了する際は、Ctrl+Qを押します。フルスクリーン表示をやめる時は「Escape」キーを押して下さい。

❏ Read More

2008-03-24 22:57:01
permalink | Software

翻訳エディタ Xin 正式版公開

Xinは、一括置換を利用して効率よく翻訳作業を行うためのテキストエディタです。
xinxin.zip(バージョン1.03 - 2008/08/22更新 - 3.37MB)
ダウンロードとインストールの詳細はこちらをご覧下さい。
詳しい使い方については、こちらのサポートブログをご覧下さい。
質問や要望はこちらの掲示板までお寄せください。
動作画面はこちらのScreencastをどうぞ。

Xinでできること

一括置換

一括
<p>置換

テキストファイル中の「AAA」を「BBB」に、「CCC」を「DDD」に置換する必要がある場合、通常はエディタやワープロの置換機能を使って処理することになるでしょう。でも、こうした置換を何十件、何百件と処理する必要があり、おまけに毎日のように頻繁に処理しなくてはならないとすれば、これはちょっとした拷問ですし、考えるだけでうんざりします。

Xinは、こういうパターン化した複数件の置換処理を高速に行います。数メガバイトのファイルでも「ファイルから一括置換」機能を使えば、処理は一瞬で完了します。長いパターンを優先的に処理するかたちで置換を行いますので、「ABABAB」を「CDCDCD」に置換する処理と「AB」を「EF」に置換する処理を同時に行う際、対象のテキストファイルに「ABABAB」と「AB」の両方が含まれていても正しく処理することができます。

Xinは、一括置換を高速に行うために内部処理を最適化していますので、たとえ数万件の置換パターンが登録されていても高速に処理を行うことができます。サンプルファイルとして中国の簡体字を単語単位でピンインにするためのパターンファイルや台湾などで使われている繁体字を簡体字に変換するためのパターンファイルを同梱しています(どちらにも数千から数万のパターンが登録されています)。

さらに詳しく

翻訳支援

対訳表示

Xinの高速な一括置換を利用した翻訳支援機能が「ghost」です。対象のテキストを文章単位で区切り、そのテキストに一括置換を適用した上で、「原文」と「一括置換を適用したテキスト」を上下に対訳表示します。

原文を参照しながら「一括置換を適用したテキスト」の部分を上書き翻訳することで効率よく作業を進めることができ、作業完了後は訳文だけの状態にボタンひとつで整形することができます。

翻訳作業が完了し、訳文だけの状態に整形する際、原文と訳文は対訳形式で内部データベースへと保管されます。このデータベースは自由に検索することができますので、過去の翻訳データをいつでも参照することができます。

さらに詳しく

多言語エディタ

多言語対応

Xinは、Unicodeに対応しています。そのため、英語テキスト中の特定の文字列を中国語に変換したり、日本語の漢字を簡体字に変換したりすることができますし、複数の言語が混在していても問題なく表示することができます。

UndoやRedo、クリッカブルURL、タブによる複数のファイル管理、強調表示、検索と置換といったエディタとしての基本的な機能を備え、行間や折り返し、文字色や背景色など細かい部分まで設定を行うことが可能です。

また、EUC-JPやシフトJIS、UTF-8やGB2312、BIG5など複数の文字コードでのファイルの読み書きにも対応しています。


検索・検索・検索

WEB検索ユーザー辞書

Xinの右クリックメニューからは、ユーザー辞書の検索、対訳DBの検索、WEB検索を行うことができます。

選択テキストを簡単に効率よく検索できる上、ユーザー辞書やWEB検索は自分の好きなように登録・編集することができます。

ユーザー辞書についてさらに詳しく
WEB検索についてさらに詳しく

見出し一覧

見出し一覧

ツールメニューの「見出しの表示」を使えば、特定の文字列からはじまる行を抽出し、目次のように一覧表示することができます。

たとえば、法律や契約書を編集している際に、行頭文字の入力欄に「第」を入力し、「表示」を実行すると「第」ではじまる行が一覧表示されます。クリックすればその行へとジャンプできますので、長いテキストも効率よく編集することができます。

さらに詳しく


2008-02-26 12:19:56
permalink | Software

中国の検索ランキング

中国や台湾で何が話題になっていることをを把握したい場合に便利なのが検索キーワードのランキングです。大手の検索サイトであれば、ほとんどのところがジャンルごとにキーワードの集計を行っていて、話題になっているドラマや映画、アニメ、歌などを確認することができますし、百度の上升最快风云榜や雅虎搜索の上升最快搜索词では検索回数が急速に伸びているキーワードを確認することができます。

大陸の検索ランキング

台湾と香港の検索ランキング

個人的に気に入っているのは、谷歌热榜です。谷歌热榜 - 十二月热词点评のように月ごとの話題がまとめてあったり、右のように気になるランキングを自分のホームページに貼り付ける機能も用意されています。*1

■ 谷歌のランキングを自分のサイトに貼り付ける方法:

谷歌热榜の各ランキングの下方にある「更多」をクリックするとそのランキングの詳細を確認できます。詳細ページの画面右上に「添加到您的网站」というリンクがありますので、これをクリックするとパーツ作成用のページが表示されます。項目や色を選択した後、HTMLタグをコピーして自分のサイトに貼り付ければ作業完了です。

*1:注:ここに貼り付けてあるのはランキング表示用パーツの見本画像です。

2008-02-02 22:33:51
permalink | Chinese

中国語のフォント

SimSunやMingLiu以外の中国語フォントを使いたいときや、ちょっと雰囲気がある中華フォントを使いたいというときのために、ネット上で入手可能なフォントのことをまとめました。

なお、ダウンロードしたフォントは、適宜解凍して「C:\WINDOWS\Fonts」あたりにコピーすると利用できるようになりますが、簡体字や繁体字を入力するにはそれぞれIMEが必要となります。中国語の入力についてはエキサイト翻訳のヘルプなどを参照して下さい。

また、フォントのライセンスについて当方は関知しませんので、利用にあたっては各サイトの説明を確認してください。

簡体字フォント

繁体字フォント

簡体字と繁体字

その他

作者のみなさまに感謝です<(_ _)>

追記

中国語PDFを開く際、Adobe Readerを利用すると中国語フォントをダウンロードすることになりますが、このフォントを他のツール上で利用することができます。

「C:\Program Files\Adobe\Reader 8.0」などにAdobe Readerがインストールされている場合、「C:\Program Files\Adobe\Reader 8.0\Resource\CIDFont」に「AdobeSongStd-Light.otf」や「AdobeHeitiStd-Regular.otf」が入っています。フォント名から分かるように「宋体」と「黑体」のフォントです。これを「C:\WINDOWS\Fonts」などにコピーすれば、ワープロソフトなどで利用することができます。

2008-01-24 12:53:37
permalink | Chinese

翻訳 - 自序

魯迅の「吶喊」の「自序」を翻訳しました。

ダウンロード:zixu.pdf (37.4KB)

2008-01-21 10:15:09
permalink | Translate

オンライン版Pinconv

オンライン版のPinconvを作成しました。入力された簡体字中国語をピンインに変換することができます。

変換は2段階に分かれていて、第1段階では簡体字を簡易ピンイン(声調を1~4の数字で表現したピンイン)に変換します。Pinconvの出力が間違っている可能性もありますので、ここで簡易ピンインを見直し、編集します。次に「声調記号」ボタンを押すと声調記号付きのピンインが出力されます。

例:原文「拼音」→簡易ピンイン「pin1yin1」→ピンイン「pīnyīn

注意事項:

  1. 一度に処理できるのは500文字までです(第2段階の簡易ピンインは2500文字までOK)。500文字を超えた部分は無視されます。
  2. 第1段階では空白文字は無視されます。
  3. 単語や漢字に複数の読みがある場合は、半角スラッシュで区切るか、括弧で囲んで併記するかたちで表示されます。
  4. Pinconvはできる限り単語単位でピンインを振ろうとしますが、単純な手法を採用しているため、ピンインが間違っている可能性もあります。処理結果の正確性について、作者は一切保証いたしませんので、出力データのご利用は自己責任でお願いいたします。

2008-01-15 13:11:26
permalink | Software

翻訳 - 小さな出来事

魯迅の「吶喊」の「一件小事」を翻訳しました。

ダウンロード:xiaoshi.pdf (17.9KB)

2008-01-12 11:01:51
permalink | Translate

翻訳 - 故郷

魯迅の「吶喊」の「故郷」を翻訳しました。

ダウンロード:guxiang.pdf (70.8KB)

2007-12-14 14:44:50
permalink | Translate

漢字検索

漢字の読みを調べたいときに便利なサイトやツールを集めてみました。

入力したい漢字の読みが分からない場合、通常はATOKの文字パレットの漢字検索で問題を解決することができます。「部首、画数、読み」から検索できますし、手書き入力にも対応していますので、たいていの場合は、これで大丈夫だと思います(MS-IMEにも同様の機能はあります)。調査対象が簡体字である場合は、北辞郎の部首画数検索を使えば調べることができます。

問題は、この2つのツールを使っても読みが判明しないケースです。たとえば「」などは上手く検索できません。こういうときは以下のサイトを使います(制作者のみなさんに感謝)。

無料で利用できるWEBサイト

  1. Unicode/CJK統合漢字
    …部首、画数、読み、コードで漢字が検索できるほか、フォントごとの違いを確認することもできます。
  2. Cojak Hanzi Dictionary
    …「Unihan Hanzi Radical Chart」ということで、こちらでもUnihanデータベースを部首と画数で検索することができます。
  3. 維基詞典
    …画面右下の「快速索引」から部首や画数による漢字検索ができます。
  4. シータ ハイパー検索
    …漢字の構成部品を利用して検索を行います。

有料のツールやWEBサイト

  1. 字通
    …親字検索、熟語検索、全文検索が用意されていて、親字検索では読みや部首、総画数、四角号碼などで漢字を検索することができます。詳細はこちらのJK版字通の特徴を参照下さい。月額料金は840円です。
  2. 超漢字検索
    …さまざまな方法で漢字検索を行うことができます。詳細はこちらのマニュアルを参照下さい。価格は6,300円です。

異体字を調べるときに便利なサイト

  1. 《異體字字典》
  2. 漢字袋

なお、簡体字のピンインを調べたり、入力したりしたい場合は、手前味噌ですがPinConv+が便利だと思います。

2007-07-30 12:31:15
permalink | Chinese