研究室でスキーに行ってきました

というような話題をブログの頭でするとその記事を読む人が減るらしい。RSSで読んでいる人はタイトル+RSSに表示される最初の2,3行で記事を読むか判断するので、そこで興味を引かれない人は読まない、ということだそうだ。

これって論文にも同じことが言えるよなあ、と思う。つまり、TitleとAbstractで読むものを決めて、そこでふるい落とされたものはあまり最後まで真面目に読まない。逆に言えば、どのようにして自分がスコープとしたい読者を引き込める魅力的な概要を書くか、ということが論文を書く上で重要である(ボスが特にAbstractとIntroductionを入念に修正するのはそういうことだと思う)。

まあ、この日記に関してはこういう時間に更新してる時点でそういうことをあんまり考えていないということでしょうw

  • -


で、表題のスキー旅行にいってきました(笑


毎年ニセコに行くことが恒例になっているのだけれども、今年は去年よりだいぶ値段が高くて宿のグレードを落とした。ニセコは今かなり人気のようで、高くても人が集まって賑わっていたし店も増えたらしい。値段が高かったら学生が参加するのもきついし(今回も学生4人)、スキースノボ初心者で参加してみたい人もいるかもしれないのにそんなお高い金額設定をするのもなあ、と思ったので来年からは場所を変えたりするかも。先生を説得できればw

ニセコは雪もスキー場もいいし、何より下手な人が少ないので安全に滑れるのがよい。来ているのが半分くらいオーストラリアなんかからきている外人さんで、英語が標準になっているのも面白いし、こんなところが日本にあるんだと思う。空港との連絡バスをさばいているお兄ちゃんですら、ネイティブの@neubigさんがびっくりするくらいしっかりした英語で喋っていて圧倒される。この街で片言でも英会話ができない人は生き残っていけないんじゃないだろうか。

英語と言えば、帰りの飛行機は非常口座席だったので緊急時の脱出補助への協力を同意することになったのだが、チケットを変えるときグランドのお姉さんに「日本語英語は大丈夫ですか?」と聞かれて面食らった。日本の航空会社で国内便なら普通は日本語だけじゃないの…笑
そういう時代になったのかもしれないが。

ともかく、楽しいスキー旅行でした。夜はDSで対戦してたしw

  • -


あと最近の話ですが、カメラのレンズを買いました。

去年の夏前に買ったNikonD5000

Nikon デジタル一眼レフカメラ D5000 ボディ D5000

Nikon デジタル一眼レフカメラ D5000 ボディ D5000

に最近出たDXフォーマットの55-300の純正レンズ

を追加で買ったのだが、さすがVR?だけあって望遠側でも手振れがよくきくし、きちんと絞りとかを調整すれば綺麗な写真がとれるので気に入っている。何より、望遠レンズにしてはすごく軽い。惜しむらくは最初の出動がスキー旅行で、あまり出番がなかったことだが…(さすがに滑ってる途中に一眼を持ち歩く気にはならない)

これからばんばん活躍してくれることでしょう。これまで撮った写真の整理もしないといけない。

  • -


最後に真面目なサーベイの話(笑

修論でさぼっていたが、最近は述語項構造を利用したQAシステムの話や、分布類似度を用いた同義語獲得の話を読んでいる。

Question and Answering System based on Predicate-Argument Matching
Daisuke Kawahara, Nobuhiro Kaji and Sadao Kurohashi (2002 NTCIR Workshop)

タイトルだけ見るとやっていることが同じでドキっとするような論文だが、基本的にはQAの知識獲得に述語項構造を用いて、マッチングにも述語項構造の一致を見ているもので、関係性のパターンや質問のタイプは人手で定義している。どちらかというと述語項構造を用いた知識獲得をして、そのマッチングにも述語項構造を使いますよという話。

ていうか読んでから気付いたけど、M1の頭の方でこの論文読んだ気がする…

Experiment with Interactive Question-Answering
Sanda Harabugiu, Andrew Hickl, John Lehmann and Dan Moldovan

これは記事から抽出した述語項構造を人手で定義したテンプレートに照らし合わせ、答えの文から質問文を生成して、QAで答えられる問題を増やしましょうというアプローチ。答えられる質問の量を増やす(質問と答えのペアを増やす)というのはQAの主流となっているアプローチで、そのパターン収集のために述語項構造の一致とそれに基づく文生成を使う。

Using Semantic Roles to Improve Question Answering
Dan Shen and Mirella Lapata

最後のこの文も、QAのための一致情報検索のために述語項構造を利用するものだが、FrameNetを使う。シソーラスを使っているぶん、たとえばsellのagentにはseller、objectにはsale、dativeとしてbuyerが入るということがわかるなど、より高度な知識獲得ができる(これも前に読んだ話だが、読み返してる)。


最近僕がやっていることは自然文検索に近いので、そちらの論文もサーベイしてみよう。