2ntブログ

どらどらテレビ

芸能、テレビ、ニュース、はてなブックマーク。かゆい所に手の届くブログを目指しています。そのためけっこう狭い範囲をキャッチした記事が多いです。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

PageTop

ボイスレコーダーについての雑談




ボイスレコーダーを使って
しゃべるコンテンツを
収集したいんですが、

ひとつ問題があります。

それはコンテンツが含まれる密度が低いことです。
録音しても
いつでもしゃべっているわけではないので、
コンテンツが含まれている質のあるの録音時間は
実際に録音している時間よりも短いことになると思います。

逆に、
コンテンツになりそうなときだけ、録音するという方法もありますが、
これはまた違った問題が発生してしまいます。
それは「そんなに都合よく録音ボタンを押せない」ということです。

これをなんとか解決してみたい。
やはり、
ずっと録音しつづける必要があるのかなぁ。

さつまいもの植え方 クロックス 新作
PageTop

文章コンテンツに対する雑談


一日にどれくらいのことをしゃべるのかは
わからないですけど、
これってけっこう凄い分量になるんじゃないかと
思っています。
いまここで文章を書いていますが、
文章で書く分量の10倍のことは一日のうちに
しゃべると思います。

このしゃべることを
文字に起こすと、
それってそれだけで十分コンテンツになるんじゃないかと思います。

しかも、今まで文字を書こうと
思って書くものとは全然質の違うコンテンツが生まれると思います。
ボイスレコーダーフル活用で、
けっこう楽しいことが出来るんじゃないかと
思うんですが、
どうでしょうか。

フェリージ キーケース 西山茉希 時計
PageTop

グーグルを支える技術 35ページ


「グーグルを支える技術」
共通のdocIDを見つけるのは比較的簡単です。docIDのリストはあらかじめ小さい順に並んでいるので、リストの先頭から順に比較して、すべてのリストに含まれるdocIDだけを抜き出していきます。これをリストの最後まで繰り返せば、すべてのwordIDを含んだdocIDのリストが得られます。後は単語1つの場合と同じように、この新しいリストにタイしてランキングを行えばよいわけです。
PageTop