2007年1月27日(土)
更新日:2008年01月10日(木)16:48
大学生活
今の時間まで、次のミーティングの資料を作成していました。ただ単に、英語の文書を日本語訳するだけなんですが、専門用語とかがいろいろと出てくるため、結構厄介です。
専門用語の訳というのは、すでに決まっているものが多く、その通りに訳さないと何が書いてあるのかよく分らない文章になってしまいます。そこでネット上で検索をかけるのですが、これがまたうまい具合に引っかからない!それっぽく訳すしかないんでしょうか。とりあえず、ブログ上に英単語と日本語訳とかを書いとけば後々楽なんでしょうが、自分の馬鹿さ加減を露呈してしまうという欠点もあったりします。
とはいえ、何もせずに失敗するよりは悪あがきをしてちょっとマシになったほうがいいかなとも思うので、そのうち訳語を公開していくかもしれません。もちろん、利用に関しては自己責任でお願いしますということでヽ(´ー`)ノ
2007年1月25日(木)
更新日:2008年01月10日(木)16:48
大学生活
月末になるとレポートの締め切りに追われることが多くなって大変です。一応、大学院生になっても講義のレポートがあるのですが、これが今までのスケジューリングの甘さのせいで、かなり危機的状況に。なんとかして間に合わせたいところです。
とりあえず、今週末のレポートと今月末のレポートだけはなんとかして出しておきたいところです。せっかく出席もしたし、それなりに頑張った講義もあるし。でも、それを頑張ると研究の英語の訳が進まないんだよな。将棋で例えるなら、いかにして詰められないように逃げるかという状況。要は、首が回ってないってことですな。
時間がかかるやつから片付けるなら、バイオとシスプロ、そして分散システム。研究の日本語訳は、単純に見積もると5時間程度で完成すると見たので、分散システムの前に押し込むのが優先順位的に良さそう。こんなこと、とても大声では言えないな?。
2007年1月24日(水)
更新日:2008年01月10日(木)16:48
大学生活
今日のお昼に突然研究室から電話がかかってきました。「今すぐ学校に来て!」むむ、何か起きたんですか!?
時間が徐々に経つうちに状況が見えてきました。どうやら、研究室のメンバーが作ったプログラムのバグが原因で、他の大学のWebサーバにアタックしていた模様。アタックの回数を聞いて驚愕。1日に170万回ですよ!1分間に換算すると1200回弱、1秒間で20回程度。アクセスしてたWebページにもよりますが、サーバに多少なりとも負荷をかけてたことには違いないでしょう。
自分のプログラムじゃないとはいえ、ちょっと間違えればやばい事態になりえることを肝に銘じておかないといけません。
2007年1月22日(月)
更新日:2008年01月10日(木)16:47
大学生活
今日は企業の方との合同ミーティングがありました。すでに自分の研究は別の分野になり、実は全然研究は進んでないのですが、とりあえず出席してメモ取りなどしようかと思い、2時間ほど奮闘してきました。前日に研究室に泊ったこともあって疲れはたまりまくり。ミーティング中にあくびが止まりませんでした。
さてさて、ミーティングでは後輩がかなり奮闘。前の合同ミーティングで言われていた課題を着々とこなしていました。なんか自分の時とはえらい違い。今年度の初めと比べると進捗はすさまじいです。だいぶ、向こうの方が頑張っているということもあるのですが、先が見えてきてうらやましい限りです。
でも実際のところは、その後輩は研究テーマとしてはとても面白くないのでなんとかしてあげたいところです。どうしたらそれっぽい研究テーマになるんだろうね。
少し話が変わるのですが、今日研究室から帰る時にマイニング班のB4は誰がサポートすることになるのか、ちょっと考えてみました。
某H氏→頑張ってくれそう!だけど、頑張りすぎそう。
某S氏→頼んだらやってくれそう。でも研究班違うしな。
某K氏→前の研究が延長になって、それどころじゃない!?
自分→忙しいとか言って逃げそうかも(⊃д⊂)
という感じで、みんな無理なんじゃないかという結論になりました。っていいのか?それは。後でとんでもないしっぺ返しが来そうでちょっと怖いです。。。
2007年1月11日(木)
更新日:2008年01月10日(木)16:44
大学生活
新年になって、まだ今年の目標などを書いてなかったので、後になってできたかどうかを確かめるためにメモっておきます。
それはずばり、「続けること」と「新しいことに挑戦すること」です。これを漢字で書くと「継続」と「挑戦」ということで、いわば相反するような内容なんですが、できれば実現させたいなぁと。社会人になった友人の話を聞くと、これまでやってきたことを「継続」することはすごく難しいという話をよく聞きます。私も、継続することで自分自身の力になることを実感することが多いので、1年を振り返った時に「継続」できたものがあるかどうかを確かめてみたいと思います。
また、「挑戦」は今の自分にとって最も欠けているものの1つだと思っています。新しいことに挑戦しなければ、自分自身の時計は止まったままです。さすがに今そんな状態に陥るのは納得いかないので、いろんなことに挑戦することで、もっと視野を広げられたらな?って思っています。とりあえずは、本をたくさん読むことから実践しようと考えています。
さあ、1年後これを振り返ってどうなっているでしょうか。
2006年12月14日(木)
更新日:2008年01月10日(木)16:38
大学生活
今日は研究室で中間発表がありました。中間発表というのは、これまで研究してきた成果を研究室のメンバーの前で発表するというもので、いわば卒論発表or修論発表の予行演習とも思われる行事なのです。でも、私自身はまだM1 なので、今回はずっと聴衆として参加です。
実は、その日は研究室で寝てたんでけっこう眠気に襲われてたんですが、発表自体はそれなりに成果を出されたみたいです。来週から海外で発表する人も2人いて、英語での発表もありました。気になってたB4の発表は残念ながら講義があって見れてなかったんですが、そろそろ差が出始めたころじゃないかな?とか思ったりして。大丈夫かな?
2006年11月30日(木)
更新日:2008年01月10日(木)16:36
大学生活
後輩から、文学部では映画がいろいろと見られる講義がある、という情報をもらったので潜入してみました。確かに普段は見られない映画が見れて有意義だと思われたんですが。。。
工学部ではありえないほど教室が狭くて、時間ギリギリに行ったら座る場所がありませんでした^^;机の横に椅子を準備してもらったので、とりあえずは座ることが出来たのですが、その場所は先生の真正面・・・。いきなり真正面ってめっちゃ緊張しますやん!内職道具も持ってたんですが、残念ながら活用されることなく、かばんの中で眠ってるだけになりました。しかも、レポートの提出日だったらしく、いきなり回収の話が。もちろんレポートなんて持ってるわけもなく、先生に怪しい目で見られたんじゃないかな?。
でも、講義の内容自体は思ってた以上に面白くて、これは受ける価値ありだと思いました。講義の冒頭で先生も言っていた通り、「文学部では自分の好きなことを追求するだけではなくて、どうして好きになるのかを考える」場所なんだなって。工学のように、モノは作る事はできないけれど、モノに対する楽しみ方とか、モノの見方を学べそうな感じでした。
同じ大学の中でも全く違う世界でしたが、同じように興味を惹かれるものがあると実感した90分でした。
2006年11月 6日(月)
更新日:2008年01月10日(木)16:34
大学生活
HOT SAXという、例外的な部分系列を発見するための手法が考え出されているようです。以下にAbstractの日本語訳を書いておきますが、いつもの通り参考程度に。。。
HOT SAX: 例外的部分時系列の発見アルゴリズムとその利用
この研究では、例外的時系列の発見という新しい問題を紹介する。例外的時系列(Time series discords)とは、長い時系列データの中で、他の部分時系列と比較して最も異なる部分時系列のことである。従って、HOT SAXアルゴリズムは時系列の中で最も普通でない部分系列の意味を発見する。例外的時系列はデータマイニングやクラスたリングの性能改善、例外の除去、集約化(summarization)、例外発見(anomaly detection)など、多くの使用法がある。我々がこれから示すように、特に例外発見に効果がある。なぜならば、HOTSAXアルゴリズムは、これまでの例外発見アルゴリズムにみられる多くのパラメータを必要とせず、部分系列の長さという直感的なパラメータ1つだけを必要とするからである。例外的時系列を発見するためにブルートフォースアルゴリズムを用いた場合、時系列の長さの2乗のオーダーが必要であるのに対して、このアルゴリズムが3から4乗速いことを示す。我々は実験のさまざまなデータを用いてアルゴリズムを評価する。特に、スペースシャトルの遠隔操作、薬品、調査、産業での例外系列の有用性を紹介する。また、さまざまな分野のデータを用いて100万を超える実験により、このアルゴリズムの有用性を示す。
[pdf]HOT SAX: Finding the Most Unusual Time Series Subsequence: Algorithms and Applications
Welcome to the SAX
2006年11月 1日(水)
更新日:2008年01月10日(木)16:34
大学生活
今読んでる論文のアブストラクトの日本語訳をメモっておきます。あくまで個人的なメモなので、参考程度で。。。
BIDE : 頻出飽和系列の効率的なマイニング
これまでの研究によって、頻出系列マイニングアルゴリズムは頻出系列を抽出するのではなく、飽和系列を抽出することが明らかになった。これは、飽和系列が完全な結果セットを小型化したものというだけでなく、より効率的なものだからである。しかし、これまでの抽出候補の保持とテスト(the candidate maintenance-and-test)を基にした多くの飽和系列マイニングアルゴリズムの研究は、支持度の閾値が低い時や系列長が長くなった時は本質的に計算時間とメモリ使用量が大きくなる。
本論文では、抽出候補の保持を行わない頻出飽和系列の効率的なマイニング手法 BIDE を提案する。双方向拡張(BI-Directional Extension)と呼ばれる新しい系列終了チェック方法(a novel closure checking scheme)を適用し、BackScan削減手法とScanSkip最適化テクニックを用いることで、これまでのマイニング手法と比べ探索空間をより削減する。実際に観測されたデータによるパフォーマンス評価によって、BIDEはこれまでの手法より優れていることを示す。また、データベースの大きさに対して線形のオーダーであることなども示す。
[pdf]BIDE: Efficient Mining of Frequent Closed Sequences
Author: Jiawei Han
2006年10月26日(木)
更新日:2008年01月10日(木)16:33
大学生活
これまでの研究をまとめた論文を某学会の論文誌に投稿しました。運がよければ、来年の7月の論文誌に掲載されます。ただ、かなり信憑性の低いものになってしまったので、採用される可能性は低いかもしれません。
そんなわけで、昨日は最後の詰めということで、大学にこもりっきりで書いてました。投稿要項などを確認していなかったせいで、Extended-Summury(英文)を1ページ書かないといけなかったり、要旨を英語に直さないといけなかったりで、準備の悪さを露呈してしまいました。とりあえずはひと段落ということですが、ゴール地点は次のスタート地点ということには間違いがなさそうです。
今日からは、そろそろ就活モードに入っていくつもりです。情報収集もしかり。セミナーなんかもできるだけ受けに行こうと思ってます。できるだけ早い時期に決まるといいのですけどね。