■
ここ最近日記を書く気にならなかったが、久しぶりに書く。いくつか内容があるのでバラバラと。
- -
僕の発表は昨日のSLUDだった。昨日のSLUDは対話システムシンポジウムなので、もちろん面白い話は多かったが、逆に知っている人の知っている研究が多かったので、まとめにはよかったという感じ。僕の発表への質問は、3件で、
- 異なるドメインへ適応する場合同義用言の辞書はどうやって作るのか
- そんな複雑なパーズをして実時間で動くのか
- 評価の正解はどうやっているのか
という3点。それぞれの答えとしては、
- 同義・対義用言を粗くクラスタリングすることはできるので、そこから人手で選別すれば1から作るよりかなり手間は減らせるはず
- パーズするといっても一文なので十分実時間で動きます。一番時間がかかるのは情報の検索。
- 評価はシステムの出力を人手で採点しています
ということ。おおよそ想定質問ではあるが、評価のところは正直痛いところ。質問応答的に考えるのであれば正解を与えて、その正解が出力できるかを測るのが適切なんだけど、それだと測れるのは質問応答だけだし。そこがどう見られるかだろうなー、ICASSP通るかも、論文誌にできるかも。
- -
今さっきHCNFを使った音声認識の話をしていた。
Hidden Conditional Neural Fieldsを用いた音声認識の検討
○藤井 康寿, 山本 一公, 中川 聖一 (豊橋技科大)
未だに音声認識は音響モデルと言語モデルに分かれていて、生成モデルが主流なのだが、近年の識別モデルの流行を考えれば、まあ出てくるだろうという研究。今後どうなるか期待したいところ。
- -
この前HMMで品詞推定を実装した。精度は最終的に88%くらいまでいったんだけど、mhangyoさんは95とかまでいってたからなんか実装間違えてんじゃないかなー。
とりあえず入門は終わって、次回からはちょっと頑張り目の実装。一回目はneubigさんがノンパラの実装を教えてくれるらしい。