SIGDIAL終わりました

初めての国際会議の口頭発表が終わりました。

練習ではいつも21分くらいだったのに、焦って喋ってしまったせいか19分ちょっとで終わってしまったりとか、質疑がしどろもどろになったりしましたが、なんとか無事終わったようです。

Proceedings of the SIGDIAL 2011 Conference

こちらにProceedingsがあるので、気になる方はpp. 59–66の

Spoken Dialogue System based on Information Extraction using Similarity of Predicate Argument Structures
Koichiro Yoshino, Shinsuke Mori and Tatsuya Kawahara

を見て頂けると幸いです。

内容としては、述語項をクエリとする対話システムを作成する際に、構造を検索クエリとしたときのスパースネスをどう解消するかという話です。

今回出た質問としては、

  • Similarity定義し、それを用いた捨象しているが例えば固有表現のようなクラスで捨象することはしないのか
  • bi-gramをクエリとする検索とは比べてみないのか
  • 評価用質問201個はどうやって作ったのか、また作成者にどのような教唆を与えたか

というような質問が出ました。さすがに対話の専門家ばかりが集まる会議だけあって、みなさん的確なところを突いてくるなあ、という印象でした。回答としては、

  • 最初それも考えたが、クラスタリングをするのにしても結局は単語どうしの類似度を定義することになるので、どれか1つを選ぶということを考えても1つ1つペアのスコアを定義するのが良い。
  • Bag of Wordsにおいて系列を考慮することはやってみたが提案手法が上回った
  • 質問はテストセットの新聞記事を事前知識として与えた上で、それを読んでいれば人間なら答えられる範囲で作った

というのが適切です。1つめはとんちんかんな答えをしましたが、2,3はまあなんとか答えられたと思います。


会議に参加した全体的な印象としては、英語力の不足を感じることが多いこと。特に議論が白熱していくと、どんどん内容がわからなくなっていくし、置いていかれてしまう。さらにそこから、自分の考えていることをうまく言語化できずに議論をとめてしまう。ポスターの場合それが顕著で脱落してしまうことが多く、もう少し頑張らないといかんなあ、という思いを新たにしました。

あと、Dialogueの業界も最近はAIやマルチモーダルを向いている人が多くて、言語だけでやろうなんてのはほんの一部なのね、ということを知った。


個人的におもしろかった発表は

Detecting Levels of Interest from Spoken Dialog with Multistream Prediction Feedback and Similarity Based Hierarchical Fusion Learning
William Yang Wang and Julia Hirschberg
Columbia University

で、対話におけるユーザの興味程度を特定して、それを後の対話における識別や学習にどう活かすかということ。彼は僕の発表のときにも質問してくれた人なのですが、なんと23歳だそうで、若い才能は世界にいくらでもあるんだなあ、ということに驚かされます。
僕も頑張らにゃいかん。

今回の一番の収穫は彼と知り合えたことですかね。僕の研究にも興味を持ってくれたし聞いてみたいこともまだあるので、またメールしてみようかな。


ちなみに今回のSIGDIALのAcceptance rateは36%くらい、Oralは投稿に対して25%くらいでした。
だいぶトップの会議らしくなってきたねえ。

明日からはhttp://acl2011.org/index.shtml