2013年度3年生ゼミの編集

* 出欠&発表日 [#s10eed36]

|名前|9/26|10/3|10/10|10/17|10/24|10/31|11/7|11/14|11/21|11/28|12/5|12/12|12/19|1/9|1/16|2/6|2/13|2/20|
|久保|○|発表|○|○|○|○|公欠|公欠|○|○|発表|○es|○|○|○||||
|宇代|○|発表|○|○|○|○|○|○|○|○|発表|○|○|就活|○||||
|南|○|○|発表|○|○|○|○|○|○|○|○|○|○|○|無断欠席||||
|山下|○|○|○|発表|部活|○|○|○|部活|○|発表|○|○|○|○||||
|土|○|○|発表|○|○|○|○|○|○|○|○|○es|○|○|就活||||
|北井|○|○|○|発表|○|○|○|○|○|○|○|○|○es|○|○||||
|平尾|○|○|○|公欠|○|○|○|○|発表|○|○|○|○|○|○||||
|小川|○|○|○|発表|○|○|○|○|発表|○|○|○es|○|○|○||||
|柳|○|○|○|○|○|○|○|○|○|○|○|忌引|○es|○|○||||
|小出|○|○|○|○|○|○|○|○|発表|○|○|○es|○|○|○||||
|塚本|○|○|○|○|遅刻|○|○|○|○|○|○|遅刻|○es|○|○||||

*連絡 [#xe75642d]
- 議論のズレの検出に関する研究。後から議論を振り返って、これは関係なかったなあと気づく発言集合は容易に判断ができるし、既存研究にもある。一方で議論が進んでいる時に、ズレていると気づくのは結構難しいし、容易に言いだせない。リアルタイムでずれていますと言ってくれるシステムがあると嬉しい。しかし、発言だけではズレを検出することは難しい。声の調子や、人のテンションなど（話しがズレだすと、気が緩むなど）は評価できないか。
- 土君と金児君で音声ミーティングを続けてもらう。金児君には３つのファイルなどの設定方法をお願いした。土君にはGoogle音声認識の精度、音量を取るプログラムを金児君からひきついで動かす、京大が出しているピッチ抽出のプログラムを使えるようになるを課題とした
- 平尾君、塚本君、日比野君で組合せ研究のミーティング。塚本君の発表が終ってから実施する

*研究テーマ [#g03a5e1f]
以下個人ごとに研究テーマなどをまとめました。それぞれに提出課題があります。〆切は2月12日(火)です。課題を完全に達成したら成績をつけます。

- 南：
-- 電子掲示板に投稿される誹謗中傷コメントの判定（B4岩佐）
-- 課題：集めてきた3000文に対して、誹謗中傷の程度を分類し、誹謗中傷の種類を分類する。エクセルデータでまとめる。
-- 提出物：エクセルデータ
-塚本：
-- 利用シーンが斬新な新商品のアイデア発想支援（B4日比野）
-- 課題：商品の使い方のうち、裏技のデータをプログラムで抽出する方法を考える。
-- 提出物：考えた方法のwordファイル

-平尾：
-- 組合せ発想におけるモノの提示において文字情報と画像情報の違いの考察（B4日比野）
-- 課題：予備実験を完璧にやって結果と考察を出す。
-- 提出物：予備実験の結果と考察をまとめたwordファイル。

-小川：
-- TETDMサイトのモジュールアップロード支援システムの構築（新規）
-- 課題：開発者をやる気にさせる仕掛けを考える。
-- 提出物：仕掛けを説明したwordファイル。

-久保：
-- チャットを使った議論において更に掘り下げて議論すべき話題の抽出（B4小林）
-- 課題：トピックの切り分け方も含めて、堀下がる特徴を考慮した話題抽出システムのアルゴリズムを考える
-- 提出物：アルゴリズムを説明したwordファイル

-小出：
-- チャットを使った議論における議論のズレの検出（B4小林）
-- 課題：トピックマップを作るために必要な、トピックの自動抽出方法を考える（きちんとメモをとっていなかったので、一部誤りがあるかもしれません）
-- 提出物： 議論のデータからトピックを自動抽出する方法を説明したwordファイル

-柳：
-- 情報量を増やした発言に着目した議論の流れの可視化（B4梁）
-- 課題：梁君のシステム出力を使って、議論を可視化する方法のイメージ図を完成させる
-- 提出物：議論の可視化方法のイメージ図を書いたpptファイル。

-宇代：
-- 英語会話で出された批判に対する効果的な返答の抽出（B4上野）
-- 課題：上野プログラムを動かせるようになる。上野プログラムを英語の文に対して適用するために、日本語の辞書のデータを英語のデータに作り替える。英語での効果的な批判の特徴を明らかにする。
-- 提出物：英語の文を上野プログラム（改）に入力し、得られた結果のwordファイル

-北井：
-- 批判に対する効果的な返答のノンバーバルな特徴の解明（B4上野）--> 魅力的な話し方のノンバーバルな特徴の解明
-- 課題：魅力期な話し方のノンバーバルな特徴を本を参考にして列挙する。お笑いの話の発言に対して、列挙した特徴を付与してデータを作る。面白い話と面白くない話でノンバーバルな特徴に差があるかを見る。差がなければ研究テーマを変える必要がある。
-- 提出物：話の中の各発言に対して、魅力的な話し方の特徴を記したエクセルファイルを提出する。面白い話10件と面白くない話10件。

-山下：
-- 音声認識を利用した対象物に対するオノマトペの抽出（新規）
-- 課題：動画のシーン検索をする対象を決める。具体例を３個だす。
-- 提出物：動画のシーン検索をすると決めた対象と、動画のシーン検索の具体例を３つあげたwordファイル。

-土：
-- 音声認識を利用した会話からの意見の抽出と相違の可視化（新規）
-- 課題：基本周波数を数値で出力するようプログラムを修正。３人くらいの会話を録音して、録音データからシステムの出力イメージを作る
-- 提出物：修正したプログラムとプログラムの出力。出力のイメージ図

*発表内容 [#ob7bd9cc]
**宇代 [#e1a96aec]
***10/3： [#v345e687]
- 海外ドラマ lie to me, numbers, 12 angry menを参考にして、批判と批判に対する効果的な返答を抽出してデータを作る。上映会をやる。次までの課題。洋画の字幕を書き起こして、批判に標をつけて、批判に対する効果的な返答に標をつける。批判は１段階ではなく、n段階だから、先読みしたモデルを作る必要がある。
***11/7 [#y3d50f18]
- 十二人の怒れる男をみて、英語の字幕をWebからひろってきて、批判と返答のデータを作った。返答の特徴がみえていないので、調べる必要がある。データを批判と返答に分けて、返答にのみみられる文法の特徴などを調べる。１週間後に上野君もまじえて、個人ミーティングをする

***12/5 [#gc73962b]
- 上野プログラムを日本語用から英語用に直した
- ４つの特徴のうち
-- 丁寧な表現を英語で表すのが難しい
-- 否定しないを「not」「n't」で
- 返答に対して、コサイン類似度と文字数を出力した。
-- (1) 英語の文に対して、上野君のデータ
-- (2)コサインを単語レベルで出すプログラムを作る
-- (3) 否定する単語notやneverなどを列挙して、否定文を抽出するプログラムを作る
-- (4) 返答を丁寧な表現とそうでない表現に分ける。丁寧な表現の特徴を探す
-- (5) 文の簡潔さを評価するのを単語数に変えて、簡潔な文を抽出するプログラムを作る

**久保 [#p21c7d4f]
***10/3： [#k05a986e]
チャットを使った議論では深い話は難しい。チャットのツールを使って議論を円滑に進めるにはどうしたらいいか。限られた文字数での議論。余り長く発言ができない。対面の話と違って、誰かが話していても、誰かが聞いていないこともある。意見がまとまりにくい。これを解決したい。チャットツールを使った議論において、話題に関連した発言をしていくと仮定して、発言が話題に対して掘り下げて議論されたか否かを評価する。話がそれたときと、話を深く掘り下げるときの両方を検出したいということだけど、両方に直接のつながりはない。議論が盛り上がればよいというわけではなく、結論が出ることを重視。掘り下げるのをどこまでやるかはどうやって検出するか。掘り下げていくと、話がそれることもある。逐次的に議論のデータをチェックして、話題がこれだというのを出すのか、議論のデータが初めにあって、掘り下げられなかったポイントを検出するのか。リアルタイムで動くシステムを作る。チャットは常に全員がオンラインではないので、対面の議論とは違う。そのときのデメリットを解消するようなシステムを作りたい。あとから議論を追いかける時、話を蒸し返すような議論がおきるときもある。チャットのデータを５つとる。テーマを設定して、チャットツールで。今来た３行が出せると嬉しい。チャットのメリットとデメリットを。新幹線要約の話が参考になる。要約は５０文字、３行くらいが感覚的にいい。

***10/31 [#jfc3a079]
- 研究目標緒理解でつまっていたので、ゼミ前に個人ミーティングをした。２週間後に個人ミーティングを設定して、（１）チャットツールを作る（２）チャットツールの議論の中で問題が起こっているデータをとってきてまとめる（３）議論の問題点をまとめる（４）解決したい問題を決定する。チャットツールを使った議論では、更新のタイムラグがある。話が円滑に進まないことがある。話の食い違いが起こりやすい。議論のズレの中でも良いヤツと悪いヤツがあって、良いヤツを探せたら嬉しい。今ある３つのチャットデータについて、ズレた発言をチェックし、それが良いズレなのか、悪いズレなのかをチェックする。 [#pcf556ba]

***12/5 [#c9cc10fe]
- 話題抽出システムの確認、議論の掘り下げの定義、議論データをトピックごとにわけ、掘り下げるべきものとそうでないものに分けた、ほり下がっているトピックの特徴の抽出、
- 掘り下げはトピックに対して意見を出し、議論が進行しているかと定義
- 今回扱う議論はテーマがある。小テーマをトピックとしている
- 話の流れで切り分けて、語られている話題をトピックとした。
- トピックが階層構造になることもあって、「たません」の話から「卵」の話になったとき、トピックが並列にはならず、上位下位の関係になる。これは今後考えて行く。
- 堀下がっているトピックの特徴の抽出
-- 議論の話題が明確（<--これは分からない）
-- 返答が特定の人物ではなく、参加者全員が参加し、返答しているとき
-- トピックに対しての返答が多い
-- 議論の論点が会話の中でマッチしているとき（<--これは、テーマとトピックが関連しているということか？）
- トピックの切り分け方をどうするかを考えないといけない
- トピックの切り分け方も含めて、堀下がる特徴を考慮した話題抽出システムのアルゴリズムも考える。2/12までにやる

**土 [#eacb81b8]
***10/10 [#lb04ce47]
- Google音声認識を試してみた。はっきりと喋ればある程度認識できる。限界と精度の数値は確認していない。固有名詞の羅列を入力して試すと限界がみえる。日常会話を入力してみる。音声認識でテキスト情報をとって、末尾の音が上がったか下がったかを音の情報からとる。それで意見の相違を抽出する。次までの課題として、PC版で音声認識が使えるように設定する。Google音声認識の精度と限界を調べる。データを用意して、どの文ならば認識できるかなどのデータを示す。精度と限界を数値として出す。そのあと、音声認識のプログラムについて個人ミーティングをしていく。
***11/7 [#i291af55]
- Google音声認識の認識率を確認した。漢字かなが混じった状態ではあるが、９割程度単語を認識できていた。間をおいて話すと大抵の単語は認識できるが（92%）、間を置かないと精度がさがった（38%）文脈のある会話であればある程度の認識はできるのではないか。音の大きさやピッチを抽出するプログラムを使えるようになることが次の課題。ベストなマイクの距離も実験的に調べる必要がある。研究で作るシステムの最終イメージを考える。次回に以上４つのことを発表する。

***12/12 [#e1e8f5f0]
- ピッチ抽出するプログラムを動かす
- changerが動かせないのでそれを動かせるようにする
- マイクのベストな距離はマイク間は1.5m、マイクと話者は20cm
- 意見の相違と類似を可視化する。
- ３人くらいの会話を録音して、出力例を作る。（2月までの課題）
- ICレコードがいるか

**南 [#a5473004]
***10/10 [#e7c7adc5]
- 研究目標および内容を理解した。漫画カテゴリで酷いコメントがかかれているスレッドを１０件、上から３００件。合計３０００文に対して、誹謗中傷かどうかの○×をつける。伏せ字の問題

***11/14 [#tb6641f0]
- 抽出した誹謗中傷のコメントに対して、(1) 誹謗中傷の程度で分類する、(2) 誹謗中傷の種類で分類するをやる。(1)(2)ができると、どの分類に対して研究を進めるかを明らかにできる。
- 調べたスレッドのタイトルやURLのデータを次回示してもらう。

***12/12 [#vedbaf24]
- 誹謗中傷コメントを種類で分類し、程度でも分類する
- 3121件のコメントのうち、誹謗中傷コメントは89件
-- 直接表現
-- 隠喩表現
-- 伏せ字
- スレッドが早く流れるほど、誹謗中傷コメントは多いことが分かった
- 他のデータについてもまとめてみる。学校裏サイトなど

**山下 [#e0564918]
***10/17 [#j8ab2546]
- 研究目標および内容を理解した。オノマトペを何を見せてとるか：静止画？動画？状況を表す動画をみせて、オノマトペをとってくる。擬態語を扱う。ラティス上のデータを用意して、それの類似性を取る方がいいかも。Juliusの方がいいかも。Google音声認識ではできないか確認する。次の課題はスポーツのDVDを集めて、Google音声認識を使って、DVDを見ながらオノマトペを入力してみた結果を報告する
***11/7 [#lfe6920e]
- Google音声認識をりようして、オノマトペの認識状況を調べた。フワフワ、ニヤニヤなどは認識できるが、撥音便が入るもの「キラッキラ」、伸ばし棒が入るもの「グーン」、濁音「バァー」、小さいやゆよ「きゅっ」などが認識されにくかった。これらのオノマトペはプレーの実況に使われることが多い。これらのオノマトペを認識できるようにする必要がある。今認識できないオノマトペを認識する方法を考えることが次の課題。２週間後に個人ミーティングをする。21日くらい

***12/5 [#yef901fd]
- Web Speech APIを使って、オノマトペがより多く減らせることを確認した
- アメフトの試合を見て、オノマトペが出されるときはいつかを調べたが、山下君が専門家すぎてオノマトペは使わない。
- 専門家と非専門家で使うオノマトペの頻度が変わって来る（これは次の研究ネタになる）
-- 「ごちゃごちゃしているところ」「アサインメント」と対応付けができる
- 動画のシーン検索の対象をアメフトに限定する
- 動画のシーン検索をオノマトペでできる例を３点あげてまとめる。

**小川 [#dcc46373]
***10/17 [#ne9730ae]
- 研究目標および内容を理解した。モジュールをアップロードしたくなるような仕掛けを考えるのが本研究の意義。既存モジュールとの関連を評価して、それによって達成できることを示してあげるとやる気が出るかも。人にやる気を出させる仕掛けを考える。自分のモジュールが他のどのモジュールをつなぐハブとなるか。それを見せるのが大事。複数のツールを組み合わせてできること、達成できることが分からなかった。使ってもらった乾燥がアップされるだけで、それが使い方が良くわからなかったというコメントであっても嬉しい。ネガティブな意見は隠しておくとよいかも。楽天トラベルのレビューの見せ方が参考になる。次の課題は人がやる気になる仕掛け、人がやる気を出せる情報の見せ方について、仕掛けを２０から５０集めて来る。集めるもとは、人が集まっているSNSや芸能、エンタメ産業、アマゾンや楽天トラベルのレビューサイトなど

***11/21 [#uf2b0a68]
- ネット上にあるデータから人にやる気を出させる仕掛けのリストをまとめた。オンラインゲームでの助け合いやゲームを盛り上げる仕掛けを探す。名誉欲をくすぐるための仕掛け、自尊心を向上させてあげるための仕掛けを考える。
- 3年ゼミで達成することはTETDMに作る仕掛けのアイデアを完成させること

***12/19 [#ee79b5f8]
- オンラインゲームをしている時に名誉を感じた瞬間を列挙
- プロフィール公開とランキングが使われていることが多い。これを組み合わせて仕掛けを考える
- サンシャイン牧場の虫の仕組みとプロフィール公開（＋ランキング）を組み合わせた仕掛けを考えた
- 5%減って12%増えるの仕組みが入っていないので、それをいれて仕組みを考え直す
- 書かせたいプロフィールの項目はプログラムに関係すること、ちょっとした自慢話であると考えられるので、プロフィールの項目を見直す

**北井 [#id85cd22]
***10/17 [#c526c041]
- 研究目標の理解。効果的とはどういうことか。ノンバーバルな中で分析するものは聴覚にしぼって分析。視覚、聴覚、言語の３つに分けられる。状況に応じて変えられるものと変えられないものがある。より魅力的な返答の仕方だと就職活動の面接時に有利。どの文脈で研究をするかを決める。続いて、決めた文脈で魅力的な返答をしているDVDを探してきて、効果的な返答の特徴をリストアップする。時間が足りなかったので個人ミーティングをする。
- すべらない話。面白い人のしゃべりかたに着目したい。次の課題は、漫才師をあつめて、動画をみて、いけてるときといけてないときの音の特徴の違いのありなしを考察。次回発表時には新しいテーマでの発表をする

***11/14 [#e2e1354c]
- 効果的な話し方のノンバーバルな特徴の解明に修正
- お笑い芸人の話し方について、面白い話し方の特徴を明らかにしたい
- お笑いの動画をみて、面白い話と面白くない話の特徴を列挙した
- 話が面白くない原因は分かりにくい
- 落語の古典は同じ話で違う人が話している
- おもしろくない話と面白い話のバーバル、ノンバーバルな特徴を明らかにするのがミッション
- おもしろい話し方の特徴が書かれている本をかい、特徴を明らかにし、お笑いの話にたいして、特徴のありなしをチェックする。まず、ノンバーバルな特徴から調べて行く。

***12/19 [#db9c5a4f]
- 魅力的な返答に関する特徴を列挙した
- 政治家とジャーナリストの討論を見て、良い返答だと思った部分に○をつけ、特徴を調べた。
- 調べた心理的な項目について、面白くない話／面白い話を列挙して○△×をつける

**小出 [#cafea41c]
***10/24 [#r7689e6d]
- 研究目標の理解。本研究における議論のズレとは、１つの話題に対して結論とは関連のない話してしまったとき。議論のズレの定義ができていない。議論のズレとは話したい話題と、今話している話題との間に関連が低いこと。チャットツールを使った議論のテキストを用意して、そこから話題が抜けるかを調べる。続いて、ズレている発言を抽出する。トピックモデルを使うとズレの発言をとれる。リアルタイムでズレを検出する。幅優先で進んでいく議論が良い議論。会話のトピックの変遷を二次元マップでとらえて、そのマップの大きさ、経路長などを調べる。トピック間の距離を測る。LDAなどが使える。潜在的トピックモデルを使う。
***11/21 [#ed02c52c]
- 研究で作りたいものはリアルタイムでトピックを検出して、議論テーマと関連のあるもの、ズレがあるものを分ける。トピックのマップを作って、議論の内容を可視化する。今は結論を使って重要なトピックを検出しているけれど、それではまずいので使わない。１つ１つの発言に対して、重要な発言とそうでない発言をチェックする。梁君の研究を参考に出来る可能性があるので、個別ミーティングをしてみる。

**平尾 [#v68cfa4c]
***10/31 [#w5a384b4]
- 研究目標の理解。軍手とスマートフォンという文字列だと、軍手型のスマートフォンカバーを思いつくけれど、実際のものをだすと軍手を使ってはスマートフォンを使えないというのが思いついて、軍手をはめていてもスマートフォンを使える機能を思いつかせる。商品とサービスの組合せを考えることもできる？　組合せ発想では機能と機能を組み合わせているとので、商品とサービスを組み合わせるならばそれぞれの機能を出せるならば組合せ発想ができる。問題は商品が使われているシーンの画像、サービスの機能を表す画像、これをどう集めたらよいか。日比野君を含めて商品データベースの打合せをする。平尾君は自分が商品を使っている写真を集めると案をだした。写真が撮れないものについてはどう集めるか、考えなくてはならない。
*** 11/21 [#vc297f2a]
- テキストだけと、画像だけと、テキストと画像を両方見せた時に出て来るアイデアの質は変わるかを実験する。
- どういう画像を見せると良いアイデアが出るかを確認したい。
- 予備実験の調整について個人ミーティングをする

***12/19 [#kf137eb3]
- 機能と機能の組合せを文字情報と画像情報で見せて、発想の違いを比較した
- 画像情報を見せた時に組合せて出て来るアイデアの違いを考察した
- 機能ではなく、モノ単体の組合せを考えさせる
- 10個のペアを作って、実験をし直す。各アイデアについて発想した理由も併せてデータを取る

***柳 [#pecd5b7c]
***10/31 [#o4cba753]
- 研究目標の理解。情報量の多い議論の板書または議事録の作成。人には議論に集中してもらって、議事録を見返す時に可視化してほしい。議論の流れを可視化する良い方法は？フローチャートを参考にしてみる。議論の流れを表す比喩を考えて、議論の流れを表す方法を考える。梁君から議論のデータをもらって、議論の一部を可視化してみる。

***11/28 [#v7bfa379]
- 議論の内容を可視化する方法を考えた。
- 議論中に生じた問題点と、問題点に対して解決策や要求を可視化した。
- 議論の要点を抽出することが難しかった。<--これは梁君のシステムを使うので、おいといて、本題は可視化の方法
- 話題と発言だけでなく、人物の流れも可視化できると分かりやすい。ドラクエのマップを思い出す。

***1/16 [#g26a981e]

**塚本 [#j06af8fc]
***11/7 [#p0c99d78]
- 研究目標の理解。利用シーンの斬新さを評価するシステムであることを再注意。商品とその利用シーンが斬新なペアのデータを集める必要があるので、１００件集めて次回のゼミで発表する。調べる際のキーワードとしては「アイデア商品」「生活の知恵」「おばあちゃんの知恵袋」など
***11/28 [#na2db39c]
- 研究内容の再確認。商品とその利用シーンが斬新なペアデータの収集。
- 「おばあちゃんの知恵袋」とかを調べた
- 商品の裏技をとってくる。裏技をどうやってとってくるかが問題。
- 商品で出来る行動を列挙したとして、裏技と普通の技を分けて見る
- 商品を20個して、商品のできる動作を列挙して、裏技と普通の技に分ける、裏技を列挙した中から自動的に抽出する方法を考える。

タイムスタンプを変更しない

* 出欠&発表日 [#s10eed36]

***1/16 [#g26a981e]

テキスト整形のルールを表示する

2013年度3年生ゼミ の編集

2013年度3年生ゼミの編集