̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ IT ニュース&コラム 2017/ 3/13 通巻733号 技術版 ソフトウェアデザイン館 Sage Plaisir 21  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄    ソース ファイルの英訳と WHITE SQUARE エンコーディング判定法 vbslib の Translate コマンドは、日本語と英語のペアが書かれた翻訳ファイル (XML)を使って、ソース ファイルやテキスト ファイルの翻訳(置き換え) を行います。 vbslib は、以下からダウンロードできます。 Windows 用です。 http://vbslib.osdn.jp/ http://www.sage-p.com/vbslib/vbslib.htm https://github.com/TsNeko/vbslib 翻訳ファイルは、以下のように記述します。複数行の翻訳もできます(説明書を参照)。 sample.txt 日本語Japanese 英語 English TranslateTest コマンドを実行すると、2バイト文字がすべて英語に翻訳されたか どうかをチェックします。 実際の翻訳は行いません。 2バイト文字が残っている 行番号を表示します。 また、翻訳ファイルには、翻訳を行った行番号が追加 されます。 翻訳されなかったときは、行番号 0 になります。これは翻訳ファイル から削除するきっかけになります。 ソース ファイルに英語と日本語を書いて、海外に渡すときは日本語をカットする 方法もありますが、これには問題があります。 それは、英語か日本語の片方だけ 変更してしまうという問題です。 翻訳ファイルを使った置き換えによる翻訳で あれば、ソース ファイルに書かれた日本語だけ変更したときは英訳に置き換わら なくなるので、英語と日本語の内容が同じであることを維持しやすくなります。 CheckEnglishOnly コマンドでは、2バイト文字が含まれていないことを指定した フォルダーの中のすべてのファイルについてチェックします。 最終チェックに 使うとよいでしょう。 ただ、日本人なら、プログラムのソース コードのコメントには、日本語で書くべき です。 英語の勉強も大事ですが、日本語で書いてあるほうが理解が早く効率的ですし、 コメントした英語がそもそも間違っていてコード以上に理解不能になるからです。 しかし、海外の人とコミュニケーションをとる人にとっては英訳しないと渡す 意味がないと思ってしまうのか、失礼だと思ってしまうのか、英訳が求められます。 会社は海外の人とも協力していかないといけない、といいますが、他の人はそれほど 深くコードを読みません。 コメントがなかったり読めなかったりすることを自分が 理解できない理由にしているのです。 文句は言ってきますが、現に、しばらくしたら コードから理解していることが多いです。(ただ、オープンソースなど業務ではない ときは、それを理由に注目されないという問題はあります。) 最近は、Google 翻訳などの機械翻訳の精度が上がっているため、英訳はそれほど 難しくなくなってきました。 企業秘密にあたる部分を他の言葉に置き換えれば、 Google に情報漏えいすることもありません。 しかし、それが逆にソース ファイル をすべてを自動的に翻訳することができない要因にもなっています。 手動で機械翻訳した結果を翻訳ファイルに記述しておけば、日本語のソース ファイル を英語のソース ファイルに変換することができます。 または、英語が苦手な プログラマーではなく、普段から英語を使って身についている営業の人に翻訳ファイル を記述してもらうこともできます。 特に中国語への変換となるとできる人は 限られます。 翻訳ファイルによって、適材適所に作業を割り振って効率的に業務が 進められるようになります。 ところで、マイクロソフト製以外では、日本語の対応がよくありません。 UTF-8 BOM にさえ対応しておらず、未だに UTF-8 しか対応していないものが多くあります。 UTF-8 BOM に対応すれば、古い Shift-JIS や EUC-jp と新しい UTF-8 BOM の 共存ができるのですが、英語圏の人にはそれが理解できないのでしょう。 また、UTF-8 しか対応してないツールの中には、Shift-JIS のファイルを壊して しまうとんでもないものもあります。 そのため、UTF-8 への切り替えは、かなり 必要に迫られています。 そこで調査した結果、UTF-8 (BOMなし) でも正しく文字コードを判定できる方法が 分かりました。 多くのテキスト エディターはもちろん、Windows のメモ帳でも 使える方法です。 それは、WHITE SQUARE エンコーディング判定法です。 ソース ファイルの先頭付近に以下のコメントを記述します。 単に記述するだけです。 先頭である必要はありませんが、以下のコメントより前には 2バイト文字(日本語、 中国語、韓国語など)がないようにします。 Character Encoding: "WHITE SQUARE" U+25A1 is □. テキスト エディターには、文字コード セットを自動的に判定する機能があることが 多いですが、どの文字も正しく判定できるとは限らないという問題がありました。 しかし、WHITE SQUARE エンコーディング判定法なら、文字 □ だけ正しく 判定することが確認できれば、他の文字が最初に来るようなファイルでも確実に 判定できることになります。 また、文字コード セットを変換しても書き換える必要はありません。 そのまま 文字コード セットを変換して保存するだけです。 一方、HTML/XML は、 encoding="Shift_JIS" のように文字コード セットの名前を記述しているため、 文字コード セットを変えて保存したときには名前を変更しなければなりません。 この作業は、よく忘れます。 また文字コード セットの自動変換をするには encoding="Shift_JIS" の部分を探すための構文解析も必要になり、自動化を 難しくしています。 Shift-JIS のファイルを壊してしまうとんでもないツールでは、文字 □ が正しく 残っているかどうかを見るだけで、壊れたかどうかがすぐに分かります。 文字化けの発見が遅れると、バックアップから復旧することが難しくなるので、 この特性も有効です。 ちなみに、WHITE SQUARE を選んだ理由は、□ 文字が目立たず単純な記号 だからです。 検討していた時は ■ を使っていましたが、文字化けしたのでは ないかと気になったのでやめました。 欧州でよく使われる文字コード ISO-8859-1 には、WHITE SQUARE がありません。 そこで、よく使われる COPYRIGHT SIGN (c) (0xA9) がよいでしょう。 Unicode でも U+00A9 ですが、バイトの列が異なるので判定は必要です。 Character Code Encoding: "COPYRIGHT SIGN" is (c). 注目ニュース 一覧 ◇ 壁や机上の画面をタッチ操作できる Xperia Touch。 http://pc.watch.impress.co.jp/docs/news/event/1046945.html … 手軽にインテリジェンスなテーブルやホワイトボードになる。 ◇ 左手にJoy-Con、右手にスタイラス。Nintendo Switch コントローラーがお絵かき用デバイスに。 http://www.itmedia.co.jp/news/articles/1703/10/news140.html … Apple Pencil より使いやすそう。 ◇ ヤマト運輸とともにAmazonプライムも値上がりする?。 http://www.itmedia.co.jp/pcuser/articles/1703/12/news015.html … 送料値上げにどう対応するかは Amazon 次第。 過剰サービスは望んでいない。 ◇ 理研と電機メーカー3社が新型人工知能開発で連携。 http://www3.nhk.or.jp/news/html/20170310/k10010905941000.html … 3社共同による大規模システムも作りやすくなるか。 ◇ ラジオ番組をそのまま書き起こしたラジオプリント、ファミマのコピー機で販売。 https://japan.cnet.com/article/35097447/ … 有料の情報を紙で配布する機能の1つの例だろう。 ◇ 意志決定をするためのリーダー用フレームワーク Cynefin Framework。 http://gigazine.net/news/20170302-leader-framework-decision-making/ … 決定方法が画一的にならなくなるのはいいが、答の数で決めるのは乱暴。 ◇ ロボットによる自動配達を認める法律が世界で初めて施行されロボット配達が解禁へ。 http://gigazine.net/news/20170303-robot-delivery-virginia/ … チャレンジングな取り組みとして期待。 ◇ ゲイツ財団に3兆円を託したウォーレン・バフェット宛てにゲイツ夫妻がこれまでの慈善活動を報告。 http://gigazine.net/news/20170302-bill-melinda-annual-letter-for-warren/ … 慈善事業がビジネスにならないような仕組みがある。 ◇ オバマ氏がクーデター計画の偽情報、グーグルが誤って拡散。 https://japan.cnet.com/article/35097658/ … フィードバック機能があるから、多くの人がそう思ったのだろう。 ソフトウェアデザイン館 Sage Plaisir 21 ホームページ >>> http://www.sage-p.com/ メルマガ >>> http://www.mag2.com/m/0000083983.html ブログ >>> http://blog.livedoor.jp/sage_p/ ツイッター >>> http://twitter.com/Ts_Neko ダウンロード >>> http://www.sage-p.com/freesoft.htm サポート掲示板 >>> http://www.sage-p.com/kg_ban09/z6037C8.cgi 東日本大震災 >>> http://www.sage-p.com/saigai.html メール >>> ts-neko◇sage-p.com ←◇を@に変えてください 緊急メールは件名に「うどんメール」を付けてください。 このメルマガの登録・解除 - http://www.mag2.com/m/0000083983.htm