Google 日本語入力

Google 日本語入力(グーグル にほんごにゅうりょく)とは、Googleが開発した日本語入力システム(IME)である。2009年12月3日にベータ版として公開され、2010年12月16日に正式版が公開された。また、Mozc(モズク)という名称で公開されたオープンソース版についても本記事にて説明する。

Google 日本語入力
開発元 Google LLC
初版 2009年12月3日 (2009-12-03)
最新版
Windows, macOS

2.25.3700.0+24.7.9
- 2019年7月28日 2019-07-28[1] [±]

Chrome OS

-
[±]

Android

2.25.4177.3.339833498.103+24.8.9 [注釈 1]
- 2020年10月30日 2020-10-30 [±]

Gboard (iOS)

2.24.0.105+24.2.9
- 2018年5月24日 2018-05-24 [±]

Gboard (Android)
2.25.4165.3.338414850.103+24.8.0
- 2020年10月22日 2020-10-22 [±]
最新評価版
Windows, macOS

2.25.3710
- 2019年7月28日 2019-07-28[2] [±]

Gboard (Android)
2.24.3280.103+24.2.0
- 2018年5月24日 2018-05-24 [±]
リポジトリ
対応OS Windows 7 以降
OS X 10.9 以降
Chrome OS
Android 4.2 以降
iOS 9以降 (Gboard)
種別 インプットメソッド
ライセンス プロプライエタリ
公式サイト www.google.co.jp/ime/

特徴

Google 日本語入力の一番の特徴は、変換辞書の豊富な語彙とそのファイルサイズの小ささである。

Google 日本語入力ではインターネット上から自動的に辞書を生成することにより、予測変換機能・タイプミスに対して「もしかして機能」を実装している。専門用語学術用語・話題の人名(〈存命の〉芸能人政治家や、漫画アニメゲームに登場する架空のキャラクター名など)から、流行り廃りの激しいインターネットスラングにまで対応する高い変換精度を誇る。特に、固有名詞の語彙力が他の日本語入力システムと比べて極めて高い[3]Google検索の語句入力から生成されたビッグデータが辞書にもたらす変換精度の高さは、インターネット上で大きな話題となった[4]

一方、文字のつながりを認識して適切な単語に変換する機能が弱かったり、連濁が正しく変換されないこともある。

他のIME(日本語入力システム)との設計上の違いとして、他のソフトウェアに依存する部分を小さくしてプロセスを分けることで、Google 日本語入力がクラッシュした場合にも、他のソフトウェアを巻き込んで落ちることがないようにした特徴がある。この設計のおかげで、辞書のアップデート時に、再起動が不要になる利点ももたらした[5]

開発の概略

Googleで「もしかして機能」を担当、形態素解析エンジン・MeCabの開発者でもある技術者の工藤拓が、その経験から日本語入力ソフトウェアとしての可能性を感じ、またオープンソースの日本語入力ソフトウェア・PRIMEの開発経験を持つ技術者の小松弘幸もアイディアを温めていた[6]

その後、この2人が中心となって「20%ルール」(勤務時間の20%を自由に使って良いというGoogleの社内ルール)のプロジェクトとして開発を開始し、この分野に詳しい貢献者を徐々に増やしながら公開に至った。

2010年2月17日から、新機能のテストとバグの早期発見を目的に開発版(アルファ版)がリリースされ、同年12月16日には正式版がリリースされた。開発版は今もダウンロードして使用することが可能だが、Google 日本語入力チームは安全性の観点から通常の使用には正式版を勧めている[7]

2010年5月11日、オープンソース版のGoogle 日本語入力であるMozcがリリースされた。そして2011年12月15日にはAndroid向けのベータ版がリリースされ、2013年4月に正式版となった[8]

更新履歴

主としてPC用のGoogle 日本語入力の更新履歴である。

  • 2009年12月3日 - ベータ版を公開[9] (0.8.186.x)。
  • 2009年12月15日 - 64bit版を公開[10]
  • 2010年
    • 1月29日 - 郵便番号から住所への変換、ひらがなからカタカナ英語への変換、テンキー入力のサポートなど[11] (0.9.248.x)。
    • 3月19日 - 学習アルゴリズム改善、入力履歴サジェストの改善など[12] (0.10.288.x)。
    • 6月25日 - 学習アルゴリズム改善、入力補助機能の改善、パフォーマンスの向上など[13] (0.11.382.x)。
    • 8月13日 - 記号辞書の拡充、ユーザビリティの向上、バグ修正など[14] (0.12.434.x)。
    • 11月17日 - スペルチェック機能、辞書の拡充、バグ修正など[15] (0.13.521.x)。
    • 12月3日 - 計算機能を追加、顔文字変換が拡張、IMEの切り替えを無効化など[16] (0.14.541.x)。
    • 12月16日 - 正式版を公開[17] (1.0.556.x)。
  • 2011年
    • 2月28日 - リアルタイム変換機能など[18] (1.1.626.10x)。
    • 7月21日 - 再変換機能、確定取り消し機能など[19] (1.1.770.x)。
    • 9月30日 - ローマ字入力のスペルチェック機能、同音異義語の意味・用例の表示、郵便番号の変換結果の追加など[20] (1.2.825.x)。
  • 2012年
    • 4月16日 - 「コマンド」機能など[21] (1.4.1031.x)。
    • 6月22日 - 誤読の訂正候補を提示する機能、Unicode表記への再変換機能など[22] (1.5.1109.x)。
    • 11月5日 - 辞書内容の更新、検索エンジンの高速化など[23] (1.6.1221.x)。
    • 12月4日 - Windows 8に対応[24] (1.7.1227.x)。
  • 2013年
    • 8月16日 - カーソル前の文字列を考慮した変換など[25][26](1.11.1515.x)。
    • 11月15日 - ローマ字入力モードでローマ字変換前の文字列をサジェストする機能など[27][28](1.12.1590.x)。

Android 版

Android向けのGoogle 日本語入力は2011年12月15日にベータ版がリリースされ、2013年4月に正式版に昇格した[8]。2020年8月よりGboardへの統合が予告されている。

Android版では、Google 日本語入力としての変換エンジンのほかにフロントエンドとなるソフトウェアキーボードも1つのパッケージとして配布されている。Androidの中でも特にタッチパネル端末ではソフトウェアキーボードで文字を入力することが主となるため、QWERTY配列のほかiOSでも採用されているテンキーをフリックして入力する方式(フリック入力)のほかに、Android版Google 日本語入力独自のキー配列であるGodanキーボードというローマ字入力をテンキーで行うことに主眼をおいた配列も実装されている[29]

バージョン1.9では、Androidの日本語IMEで主流の拡張機能であるマッシュルームにも対応した[30]

Gboard 版

GoogleがAndroid/iOS向けに開発している仮想キーボードGboardにはGoogle 日本語入力が組み込まれている。

ただしスタンドアロン版の「Google 日本語入力」[31]とは別物であり、Androidでは両者の共存が可能である。

Mozc

Mozc
iBus上で動くMozc(テキストエディタはgedit)
開発元 Google LLC
初版 2010年5月11日 (2010-05-11)
最新版 なし[32] [±]
最新評価版 2.23.2815.102+24.2.oss
- 2018年2月26日 2018-02-26[33] [±]
リポジトリ
対応OS Windows 7以降
OS X 10.9以降
Linux
Chromium OS
Android
種別 インプットメソッド
ライセンス 三条項BSDライセンス
公式サイト www.google.co.jp/ime/ 

Mozcとは、Google 日本語入力のオープンソース版である。これは2010年5月11日にGoogle日本語入力をGoogle Chrome OSに移植するために必要な部分をオープンソースしたものである[34]

オープンソース版のMozcとGoogle 日本語入力との大きな違いは、Mozcは日本語変換エンジンでありこれを用いて日本語入力を行うにはibusuimFcitxのようなインプットメソッドを別途インストールする必要がある点である。またGoogle 日本語入力の売りであるインターネット上の語句を収集して生成される変換辞書を使わず、代わりにMozcプロジェクトが作成した変換辞書を使う点も異なる。変換辞書などを含めた完全にオープンソース化に対応しないのは、インターネットから収集してきたデータが変換辞書として使われている関係上、SEO対策に悪用されないようにするためであるという[34]

Webデータから自動抽出された大規模語彙データは含まれていません。 語彙集合は基本的に IPAdic と同一です。 そのため、固有名詞以外の変換精度は Google日本語入力 とほぼ同一です。以下、Google 日本語入力で使用している辞書および IPAdic との主な違いです。
IPAdic に収録されていない、表外動詞や形容詞が一部含まれています。
IPAdic に収録されていない、Web 上に多く出現するカタカナ語が含まれています。
IPAdic の中にある単語のみで構成され、Web上によく出現する複合語 が追加 されています。(例: 再起動, 社員証)。
Google 日本語入力で使用されている辞書に含まれている カタカナ→ 英語 は含まれていません (例:アンドロイド→Android)。
Google 日本語入力で使用されている辞書に含まれている 郵便番号 → 住所 は含まれていません。
Google Japan Blog、Google 日本語入力がオープンソースになりました[34]

2014年現在のMozcプロジェクトの成果物(ソフトウェア)では、言葉と言葉のつながり(コロケーション)をもって変換精度を高める処理[注釈 2]や、言い間違い[注釈 3]を訂正する処理については実装されているものの、それを実現するための対応するデータが実質的に含まれていない点もGoogle 日本語入力と異なる点である[35]

仕様

波ダッシュ「」は、音声記号等として用いられるチルダ「~、」とは異なる文字記号であるが、Google 日本語入力の Windows 版のみ互換性問題の回避・解決のため、波ダッシュ「」にチルダ「~、」がマッピングされている。

Google日本語入力のWindows版では、この非互換性の問題の解決のため、Windows独自のマッピングに即した変換処理を行なっております。 波ダッシュと全角チルダの扱いについて - Google プロダクト フォーラム[36]

この背景には、かつてUnicode 仕様書が間違っていたことに端を発し、その仕様書通りに実装・マッピングしたマイクロソフト社の Windows では波ダッシュとして全角チルダが不適切に長年使用されてきた歴史がある。その結果、Windows 版のみ「なみ」や「から」と入力・変換を試みると候補に『~ [半] 波ダッシュ』と『 [全] 波ダッシュ』が列挙・表示される。これらはチルダである。

言葉狩り

差別用語や猥語など社会通念上好ましくない、ないしマスメディア表現の自主規制している言葉は、Google日本語のサジェスト機能では表示されない。ただし、スペースキーを押した変換からは、当該の単語が変換される様にはなっている。同様の「言葉狩り」はATOK及びMicrosoft IMEでも行われている。

脚注

注釈

  1. 単語リストのアップデートの確認が無効の場合は「+」以降のバージョンが異なる場合がある。
  2. 例えば「あつい」という言葉を変換する際に、「本が」「厚い」、「夏が」「暑い」というような組み合わせで候補の順を変える処理のこと。
  3. 例えば、「ふいんき」を「雰囲気(ふんいき)」に訂正するなど。

出典

  1. Google 日本語入力 Win/Mac 版 2.25.3700 (安定版) 2.25.3710 (開発版) について”. 2019年12月9日閲覧。
  2. Google 日本語入力 Win/Mac 版 2.25.3700 (安定版) 2.25.3710 (開発版) について”. 2019年12月9日閲覧。
  3. Googleが日本語入力システム参入 β版無料公開”. ITmedia NEWS (2009年12月3日). 2019年11月1日閲覧。
  4. 「Google日本語入力」開発者が語る、その狙い”. ITmedia NEWS (2009年12月7日). 2019年11月1日閲覧。
  5. Google 日本語入力 TechTalk 2010
  6. 松本淳. IMEとして「変態」 開発陣が語るGoogle日本語入力”. ASCII.jp. 2014年8月12日閲覧。
  7. Google 日本語入力に開発版が追加されました。2010年2月17日
  8. Google 日本語入力チーム (2013年4月4日). Android 版 Google 日本語入力がベータ版から正式版になりました”. Google Japan Blog. 2014年8月12日閲覧。
  9. Google Japan Blog: 思いどおりの日本語入力 - Google 日本語入力”. Google (2009年12月3日). 2012年8月30日閲覧。
  10. Google Japan Blog: 64 ビット対応版 Google 日本語入力リリース”. Google (2009年12月15日). 2012年8月30日閲覧。
  11. Google Japan Blog: Google 日本語入力がアップデートされました。”. Google (2010年1月29日). 2012年8月30日閲覧。
  12. 日本グーグルブログ 2010年3月19日
  13. 日本グーグルブログ 2010年6月25日
  14. 日本グーグルブログ 2010年8月13日
  15. 日本グーグルブログ 2010年11月17日
  16. 日本グーグル開発者ブログ 2010年12月3日
  17. 日本グーグル開発者ブログ 2010年12月16日
  18. 山崎富美 (2011年2月28日). Google 日本語入力の開発版をアップデートしました。(1.1.626.10x)”. Google Japan. 2011年3月3日閲覧。
  19. 隅田洋 (2011年7月21日). Google 日本語入力をアップデートしました。(1.1.770.x)”. Google Japan. 2011年7月23日閲覧。
  20. 梁成基、渡辺雄也、楠本充 (2011年9月30日). Google 日本語入力の安定版をアップデートしました。(1.2.825.x)”. Google Japan. 2011年10月9日閲覧。
  21. Google Japan Blog: Google 日本語入力の安定版をアップデートしました(1.4.1031.x)”. Google (2012年4月16日). 2012年8月30日閲覧。
  22. Google Japan Blog: Google 日本語入力の安定版をアップデートしました(1.5.1109.x)”. Google (2012年6月22日). 2012年8月30日閲覧。
  23. Google Japan Blog: Google 日本語入力の安定版をアップデートしました(1.6.1221.x)”. Google (2012年11月5日). 2012年12月4日閲覧。
  24. Google Japan Blog: Google 日本語入力 安定版アップデート : Windows 8 に対応(1.7.1277.x)”. Google (2012年12月4日). 2012年12月4日閲覧。
  25. 柳英俊 (2013年8月20日). Google、文脈に応じた変換に磨きをかけた「Google 日本語入力」安定版v1.11を公開”. 窓の杜. 2016年11月27日閲覧。
  26. Google 日本語入力の安定版をアップデートしました。(1.11.1515.x)”. Google (2013年8月16日). 2016年1月27日閲覧。
  27. 長谷川正太郎 (2013年11月19日). Google、「Google 日本語入力」v1.12の安定版を公開”. 窓の杜. 2016年1月27日閲覧。
  28. Google 日本語入力の開発版をアップデートしました。(1.12.1599.10x)”. Google (2013年11月11日). 2016年1月27日閲覧。
  29. Developer Relations Team (2012年10月4日). Android 版 Google 日本語入力をアップデートしました。(1.6.1209.3)”. Google Developer Relations Japan Blog. 2014年8月12日閲覧。
  30. Developer Relations Team (2013年3月7日). Android 版 Google 日本語入力をアップデートしました。(1.9.1362.3)”. Developer Relations Japanese Blog. 2014年8月12日閲覧。
  31. Google 日本語入力 - Google Play のアプリ
  32. mozc/README.md at master · google/mozc · GitHub”. 2018年2月2日閲覧。
  33. mozc/mozc_version_template.bzl at master · google/mozc · GitHub”. 2018年1月15日閲覧。
  34. Google 日本語入力チーム (2010年5月11日). Google Japan Blog:Google 日本語入力がオープンソースになりました”. Google. 2010年9月12日閲覧。
  35. mozc/about_branding.md at master · google/mozc · GitHub”. Google (2016年8月19日). 2018年1月17日閲覧。
  36. 波ダッシュと全角チルダの扱いについて - Google プロダクト フォーラム”. 2015年2月8日閲覧。

関連項目

外部リンク

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.