今、研究関連でプログラムを組み始めてます。CSVファイルを読み込んで、そのデータにPAA(=Piecewise Aggregate Approximation)を適用するんですが、その際にCSVファイルを読むスレッドと、計算に回すスレッドは分けるべきか考えてます。
分けたときのメリットとして、ファイルを読みながら計算をできる点があります。つまり、普通の場合より早い時点で計算を開始できるので、ちょっとだけ時間を短縮できます。ですが、もちろんデメリットもあって、入出力スレッドと計算用スレッドと同期を取る必要があって、その処理にCPUを使ってしまう点。また、2つに分割することで処理がやや複雑になってしまう点。
ファイルを読んでる間に、他の初期化を全部すませておいて、一気に処理するとかいう言い訳も思いつくんですが、なんだか分けない方がいいような気がしてきました。
コメントする