進捗(8/13~8/19)

翻訳作業の方法論

定型表現についてまとめたノートのブラッシュアップ、法令用語の確認、データのエラー訂正方法の復習などをした。

定型表現

関連出願の相互参照について、公開特許公報の訳を研究した。具体的には、先日受けた模擬トライアルの解説・解答例を参考にしながら、数カ月前に自作した”関連出願の原文vs対訳ノート”に、自作の訳文を追加した。10個目を超えたあたりから徐々に慣れてきて、最終的には機械的に訳が作れるようになった。また、公報からコピペしただけだった対訳に、気になる点についてコメントを追加した。

定型表現が多い箇所の訳練習には、この方法がとても有効な気がするので、来週は結語表現についても同様の作業をする。

法令用語

「ハ」と「ガ」の使い分けや冗長な表現について、実際の特許公開公報がどうなっているのかを調べた。2017年の出願数が上位3位までの代理人について特許庁のデータベースで公報を確認したところ、「ハ」と「ガ」を明確に使い分けている明細書は少なかった。公報の対訳を鵜呑みにして、そのままTMに入れる危険性を再認識した。

また、Amazonで注文した法令用語のテキストが届いたので読み始めた(下図:目次の1ページ目)。「および」と「または」だけでなく、今までなんとなく使っていた日本語に、ちゃんと役割が与えられていたので驚いた。知らないって恐ろしい。

 

エラー訂正

職場の昼休みを読書に充てている。先週、やっと読み終えた本『量子コンピュータとは何か』の中で、エラー訂正についての分かりやすい説明を見つけた。サイモン・シンなどもそうだが、サイエンス・ライターというのは、本当にすごい人達だと思う。複雑な概念の要点を、言葉だけで表現できるのは、やっぱりプロだ。

以下、本書より、エラー訂正技術の説明をつまみ食いしてまとめたノート(一部)

単純な方法:多数決の原則

コンピュータや電話回線でメッセージを正しく伝えるためには、同じものを3つ送信すればよい(含まれるエラーの最大数が1つの場合)。重複の回数を多くしていくと、すべてが同じエラーを起こす可能性はゼロに近づいていく。

やや単純な方法:各ビットの繰返し

メッセージが1011だとすれば、各ビットを3回ずつ繰返し、111 000 111 111とする。
送信中にビットが1つ反転して、111 000 101 111となったとしても、すぐにエラーを見つけて訂正できる。重複の回数を増やせば、複数回のエラーにも対応できる。

工夫された方法:パリティ・ビット(1ビットのエラー訂正)

送信したいビット列(例えば、11001)に含まれる1の個数が偶数ならば、ビット列の末尾に0を、奇数ならば1を追加して送信する。受信者は、1のビット数を数え、それが末尾のビットに一致するかどうかを調べる。一致しなければ、データを破棄して、再送を依頼する。

もっと工夫された方法:ハミング・コード(2つ以上のパリティビットを用いること、受信側でエラーの位置を特定し訂正する)

・4ビットのメッセージ(ABCD)に、3ビットのパリティ・ビット(XYZ)を付けて送信する。
X:ABCに対するパリティ・ビット
Y:BCDに対するパリティ・ビット
Z:ABDに対するパリティ・ビット

3つ組同士が重なっていることにより、メッセージ部分(たとえば1101)の中でエラーが生じれば、必ずパリティ部分(001)の複数のビットがおかしくなる、ことを利用する。

さらに工夫された方法:メッセージ部分を2組のパリティ・ビットで挟む。

・右側のパリティ・ビット:記憶レジスタとして使う(つまり、変化させない)
・左側のパリティ・ビット:動的レジスタとして使う(つまり、メッセージ部分の変化に応じて、随時更新されるようにする)

・メッセージが届いたら、2組のパリティ・ビットを比較し、食い違いがあれば、問題の箇所のメッセージ・ビットを反転させる。メッセージ部分自体をを読む必要はない。