おそらくこれは個人ではできなかったことです。一人ではなんとなくやめてしまうようなことも、わからないことを聞ける人がいたり、なんとなく周りに人がいるということだけで続けられている部分がありました。部の性格上顔を合わせるということは少なかったですが、Slackの投稿やリアクションがかなりモチベになっていました。ありがとうございます。

部のSlackには残るはずなのでよろしくお願いします。

また適当に話したいですね。

2020-12-09

快適な日本語入力を巡る旅

この記事は群馬大学電子計算機研究会 IGGG Advent Calendar 2020 - Adventar 9 日目の記事です。

もう四年生も終わりに近づいてきています。大学生活はあっという間でした。現在卒論に追われています。

快適な日本語入力を巡る旅

一時期、「コンピュータ上で日本語を入力するには一体どの方法がベストアンサーなのか」という問題について色々考えていたことがありました。

現在僕は、「備え付けのJIS配列キーボード」で「VS CodeのEmacsバインド」で「macOS標準のIMEのかな入力」を使って文章を書いています。

ここに至るまでの検討の道を振り返ってみます。

基本方針

極力デフォルト設定を用いる (種々の変更の管理と把握が面倒であるため)
どれだけ一般的かも考慮に入れる (自分のマシンでしかうまく動かせないを避ける)

ローマ字入力 VS かな入力

ローマ字入は恐らく一番一般的な入力方式! 母音と子音の組み合わせで日本語を入力していきます。

o ha yo u => おはよう

かな入力はJIS配列のキーボード上にプリントされた平仮名を直接入力して入力する方式です。

お は よ う => おはよう

ローマ字入力は基本的にキーボード三段で入力が可能ですが、かな入力は4段のキーが必要で手を動かす範囲が増えます。

しかしながらかな入力はキーを押す回数がローマ字入力に比べて少ないと言うメリットがあります。約半分。これはすごいことです。ローマ字入力でガチャガチャガチャとしても、平仮名になって短くなって、漢字変換でさらに短くなるのは見ていて辛いです。

そんなわけで僕はかな入力を練習しました。

DDSKとAZIK

プログラミングに使うエディタをSpacemacsにしていた時期がありました。この時SSKとAZIKというものを知りました。

SKK

SKKはEmacsで動く日本語入力システムです。https://ja.wikipedia.org/wiki/SKK
これを発展させてOSレベルでもSKKが使えるようにしてくれてあるものもいくつかあります。

SKKはモードの概念があります。平仮名モードで入力した場合は平仮名が確定された状態で打ち込まれます。カタカナモードで入力した場合も同様で、英文モードもあります。

変換したい時のみ変換キーを押して、漢字にしたい平仮名を打ち込み、再度変換キーで変換します。

一般的な入力は「適当な長さを入力 ->SPACEキーで変換」と言う流れですが、 SKKは手書きをする感覚に近いです。手書きでは先に平仮名が出るのではなく、漢字を書くぞ!と思ってから漢字を書き、平仮名を書くぞ!と思って平仮名を書きます。

「もの」、「こと」、「いく」あたりの文脈に応じた変換が簡単にできます。

スシテム自体はよくできていると思ったのですが、10年後活発に生きているものかと言う点と、最新の語彙に対応している辞書かと言う点を考えるとマイナスポイントだと判断して使うのをやめました。

AZIK

http://hp.vector.co.jp/authors/VA002116/azik/azikinfo.htm

ローマ字入力の拡張版という位置付けです。ローマ字入力は子音->母音という入力順ですが、母音は5種類しかなく無駄なキーが生まれてしまいます。このような無駄なキーに妥当な変換を割り当ててローマ字入力を便利にしよう!というものがAZIKです。すごい発想です。

例えば二文字目に「ん」が来るような時はＺ(Ａの下)、Ｋ(Ｉの下)、Ｊ(Ｕの下)、Ｄ(Ｅの下)、Ｌ(Ｏの下)を押すことによって「母音+ん」の入力が一ストロークで済みます。

T Z J J -> たんじゅん

その他色々な拡張があります。かな入力よりも少ないストローク数で入力できる場合もあります。

かな入力を覚えるのは流石にめんどくさいという人にもお勧めできます!!

ただかな入力を知っていた身としては、AZIKでストローク数を減らしたところでかな入力でも同じストローク数であるようなケースが多く、かな入力に戻りました。

Vim Emacs バインド

Vim/Emacsはプログラミング界隈で著名なエディタです。 Command/Win + C でコピー、矢印キーで移動というよりも、さらにテキスト編集に優れた機能が沢山です。

現在僕はVS Codeというエディタを使っているのでVim/Emacsユーザではありませんが Vim/Emacsのキーバインド(キーボードショートカットのようなもの)を模倣した拡張機能があるのでそれを用いています。

Vimはモードという概念があります。ノーマルモードで移動、コピペ、削除、ビジュアルモードで選択、挿入モードで入力します。

Emacsはモードという概念はなく、代わりにCtrlキーやOption/Altキーを多用します。

英文のみの場合はVimバインドが心地よいと感じることが多いですが、 Vimのモード変更の際に一旦かな入力から英数入力に戻さなければならず、不便でした。

Emacsバインドはかな入力時でもCtrl/Option/Altキーを用いた操作は可能なので日本語入力という面ではこちらが向いていると感じます。

まとめ

一口に日本語入力と言ってもいろんなものがあるのだと改めて実感しました。色々な入力方式を試してみるのは面白いですね。

参考になれば幸いです。

おまけこぼれ考察

Dvorak配列

英語入力においてはかなり効率的に入力できるらしいです。ただ英語入力においてだけであり、Vim/Emacsのキーバインドとは相性がよくないという話を聞きました。 QWERTY配列のJISキーボードが備え付けられているのにわざわざ変更するの? という点と、一般的ではないという点から導入に積極的ではありません。とはいえ少しの興味はあるのでいつか試すかも知れません。

IME

標準以外だとMozcやATOKやGoogle日本語入力が有名ですね。お金ないので無料のものを使いたいです。今は標準のものを使っていますが、今度Google日本語入力入れてみることにします。

2019-12-22

SketchRNN を作った

この記事は群馬大学電子計算機研究会 IGGG Advent Calendar 2019 - Adventar 15 日目の記事です。一週間遅れの.

B3 であるということもあり,研究室ではあまり成果を要求されることはないのでゆるりとやっており,その一環として SketchRNN を作りました.

結果はこんな感じです.

f:id:KenjiOhata:20191222192536p:plain

モデル概要

SketchRNN は Google の Magenta プロジェクトの一環として作られたスケッチ生成のためのモデルです.

中身の基本はは seq2seq の VAE になっています.筆の動きを表す,ストロークデータを入力することで,ストロークを再現するように学習します.

左が入力で右が出力になります.

f:id:KenjiOhata:20191222192539p:plain

SketchRNN ではニューラルネットワークの出力はストロークデータではなく, ストロークデータを生成するような確率分布のパラメータを出力します. これにより,ランダム性を残しながらスケッチ生成ができます.

詳細は論文を参照ください. https://arxiv.org/abs/1704.03477

Julia -> Pytorch

SketchRNN の作成に取り掛かったのは 11 月中旬くらいでした. 最初の段階では Julia と Flux.jl で実装することを考えていました.

Julia 採用理由として

Python のようにライブラリを通して行列演算をすることの煩わしさがないことや, exp などから標準であること,Unicode の利用でコードの見た目がかなり簡潔になることか挙げられます.

また,Julia 自体にも興味があったので速度の面や実用さを知りたかったというのもあります.

結果として,Pytorch で書き直すことになりました.

自分が書いたコードが GPU で動かなかったからです. 公式サンプルは動きますが,僕の書いたコードはエラーが残ってしまいました. 追求すれば解決できるかもしれませんでしたが,GPU で動かすことに時間を費やすことは SketchRNN 実装とは違うので本筋を見失わないうちに Pytorch に移行しました.

ただ,Julia はマクロ機能や Unicode などほんとにいい言語だと思いました. Flux.jl もまだバージョン 1 にもなっていない(2019/12 現在)のでまだ,成長を待つ段階なのだと思いました.

オンプレ機械学習いいな

初めてオンプレでまともに機械学習をしました. 今までは Google Colab を使用して来ましたが,時間制約のおかげで, 12 時間毎に操作が要求されたり,その間のコンピュータの使用が制限されるなどろくなものではなかったので,オンプレ最高でした.研究室に感謝です.

今回作成した SketchRNN-Pytorch のレポジトリはこちらにおいておきます.

github.com

オオハタの研究ノート

考えたこととか勉強したこととか、書いていきます。

IGGGとの3年間振り返り

IGGGとの3年間振り返り

2年

IGGG_Briefing_＃2018-June

IGGG Journal "Lollipop" Vol.08

アドベントカレンダ

IGGG_Meetup_2019-Spring

3年

IGGG_Briefing_＃2019-Apr

群桐祭_2019

アドベントカレンダー

4年

結び

快適な日本語入力を巡る旅

快適な日本語入力を巡る旅

基本方針

ローマ字入力 VS かな入力

DDSKとAZIK

SKK

AZIK

Vim Emacs バインド

まとめ

おまけこぼれ考察

Dvorak配列

IME

SketchRNN を作った

SketchRNN を作った

モデル概要

Julia -> Pytorch

オンプレ機械学習いいな

IGGGとの3年間振り返り

2年

3年

4年

結び

快適な日本語入力を巡る旅

基本方針

ローマ字入力 VS かな入力

DDSKとAZIK

Vim Emacs バインド

まとめ

おまけ こぼれ考察

Dvorak配列

SketchRNN を作った

モデル概要

Julia -> Pytorch

オンプレ機械学習いいな

おまけこぼれ考察