2006年11月のエントリー 一覧

HOT SAX: Finding the Most Unusual Time Series Subsequence: Algorithms and Applications

  • 更新日:
  • 大学生活

HOT SAXという、例外的な部分系列を発見するための手法が考え出されているようです。以下にAbstractの日本語訳を書いておきますが、いつもの通り参考程度に。。。

HOT SAX: 例外的部分時系列の発見アルゴリズムとその利用
この研究では、例外的時系列の発見という新しい問題を紹介する。例外的時系列(Time series discords)とは、長い時系列データの中で、他の部分時系列と比較して最も異なる部分時系列のことである。従って、HOT SAXアルゴリズムは時系列の中で最も普通でない部分系列の意味を発見する。例外的時系列はデータマイニングやクラスたリングの性能改善、例外の除去、集約化(summarization)、例外発見(anomaly detection)など、多くの使用法がある。我々がこれから示すように、特に例外発見に効果がある。なぜならば、HOTSAXアルゴリズムは、これまでの例外発見アルゴリズムにみられる多くのパラメータを必要とせず、部分系列の長さという直感的なパラメータ1つだけを必要とするからである。例外的時系列を発見するためにブルートフォースアルゴリズムを用いた場合、時系列の長さの2乗のオーダーが必要であるのに対して、このアルゴリズムが3から4乗速いことを示す。我々は実験のさまざまなデータを用いてアルゴリズムを評価する。特に、スペースシャトルの遠隔操作、薬品、調査、産業での例外系列の有用性を紹介する。また、さまざまな分野のデータを用いて100万を超える実験により、このアルゴリズムの有用性を示す。

[pdf]HOT SAX: Finding the Most Unusual Time Series Subsequence: Algorithms and Applications
Welcome to the SAX

合宿終了

  • 更新日:
  • オーケストラ

今日、神大オケの合宿が終了しました。OBになって3回目。遊びに行ってるわけでもなく、一応は練習しに行ってます。年齢はともかく、他は現役と変わらないですね。

今回は初めてバイクで合宿場へ向かいました。予想通りかなり疲れます。まず高速で100km/s強出すと風が強くて、体に力入りっぱなし。ミラー見るときに風の抵抗で一瞬前見るタイミングが遅れるし。初めて通ったコースということもあり、プレッシャーもけっこうなもの。

高速降りた後も、山道を低速で進んでいったんで、右手も左手も痛い。天理のあたりで車が多すぎ&遅すぎ。2人乗りしてたんで、ゆっくり走るとすごく疲れるんです。ふらふらするし、前をいつも注視してないと追突してしまうかもしれないし。今回の運転で、技術的にかなり鍛えられました。

練習は、思ったよりコマが少なくて自由な時間がたくさんありました。そんななか、練習もするんですがついでにDSでマリカーも対戦とかしてました。友人Dと対戦したらボロ負けしたんでちょっとどうだろうと思ってたんですが、案外善戦したんでOKかな。11月の演奏会のための練習があまりできなかったのが心残り。

飲み会は、1日目はさっさと撤退、2日目は長々と6時まで。2日目はほとんどTrpパートとの合同飲み会のような感じになってましたが、それはそれで楽しかったかな。でも、いろいろ事件が起きてたみたいですが。

そんなわけで、オケの練習の量自体はそれほど多くなかったんで、どちらかといえばバイクの長距離走行の方が練習になった合宿でした。でも、道さえ分かればバイクで行くのも悪くないかな。

BIDE: Efficient Mining of Frequent Closed Sequences

  • 更新日:
  • 大学生活

今読んでる論文のアブストラクトの日本語訳をメモっておきます。あくまで個人的なメモなので、参考程度で。。。

BIDE : 頻出飽和系列の効率的なマイニング
これまでの研究によって、頻出系列マイニングアルゴリズムは頻出系列を抽出するのではなく、飽和系列を抽出することが明らかになった。これは、飽和系列が完全な結果セットを小型化したものというだけでなく、より効率的なものだからである。しかし、これまでの抽出候補の保持とテスト(the candidate maintenance-and-test)を基にした多くの飽和系列マイニングアルゴリズムの研究は、支持度の閾値が低い時や系列長が長くなった時は本質的に計算時間とメモリ使用量が大きくなる。
本論文では、抽出候補の保持を行わない頻出飽和系列の効率的なマイニング手法 BIDE を提案する。双方向拡張(BI-Directional Extension)と呼ばれる新しい系列終了チェック方法(a novel closure checking scheme)を適用し、BackScan削減手法とScanSkip最適化テクニックを用いることで、これまでのマイニング手法と比べ探索空間をより削減する。実際に観測されたデータによるパフォーマンス評価によって、BIDEはこれまでの手法より優れていることを示す。また、データベースの大きさに対して線形のオーダーであることなども示す。

[pdf]BIDE: Efficient Mining of Frequent Closed Sequences
Author: Jiawei Han

このページの上部へ

About

tetsuの日記・雑記です。
日々経験したことを記録していきます。

広告

サイト内検索

最近のピクチャ

  • リアディレーラ

月別アーカイブ

最近のコメント