Skip to main content

Home/ SmartGuys/ Group items tagged data

Rss Feed Group items tagged

Ken Wakita

Pajek data: Corporate interlocks in Scotland (1904-5). - 0 views

    • Ken Wakita
       
      鈴木くん、ハイライトしたところを読んでおいて!
Ken Wakita

Data Sets | GroupLens Research - 0 views

  •  
    協調フィルタリングで有名な GroupLens グループのデータセット。 -- しましまさんから久保山さんに因子分析に都合がよいデータとして呟かれた情報より
Ken Wakita

What are cross-validation and bootstrapping? - 0 views

  • k-fold cross-validation
    • Ken Wakita
       
      LOO は k-fold の一種 LVO は k-fold をはずれる気がする。
  • Leave-v-out
  • leave-one-out
  • ...4 more annotations...
  • hold-out
    • Ken Wakita
       
      cross-validation と hold-out はしばしば混同されるけれども前者の方がはるかに優れている点については、文献リストの Goutte (1997) が述べているそうだ。
  • Goutte, C. (1997)
    • Ken Wakita
       
      cross-validation is markedly superior for small data sets; this fact is demonstrated dramatically by Goutte (1997) in a reply to Zhu and Rohwer (1996)
  • Jackknifing
  • the probability of selecting the "best" does not converge to 1 (as the sample size n goes to infinity) for leave-v-out cross-validation unless the proportion v/n approaches 1
  •  
    Leave one out cross validation is asymptotically equivalent to AIC. (LOO が漸近的に AIC と一致すること)について豊田さんが呟いて教えてくれた。
Ken Wakita

SUSHI Preference Data Set - 0 views

  •  
    寿司ネタの嗜好についてのデータセット -- しましまさんのデータです。使うときには、感謝の気持ちを込めて彼に呟いてあげましょう。
Ken Wakita

Collaborative filtering dataset - dating agency - 0 views

  •  
    出会い系サイトで収集されたマッチングデータ -- 17,359,346 anonymous ratings of 168,791 profiles made by 135,359 LibimSeTi users as dumped on April 4, 2006
Ken Wakita

AudioScrobbler Data - 0 views

  •  
    しましまさんから久保山さんにお薦めにあったデータセット。LastFM の過去のデータがパブリックドメインとして提供されています。現在は、このようなデータは公開されていないようです。
Ken Wakita

Snow Leopard Bug Responsible for Loss of User Data Gaining Notice [Updated] - Mac Rumors - 1 views

  •  
    ゲストアカウントを使用している人は Snow Leopard へのアップグレードでデータを丸ごと失うかもしれないそうです。予めゲストアカウントの利用を中止してから、アップグレードし、そこでゲストアカウントを開始するのは安全みたいです。
Ken Wakita

HCE - Hierarchical Clustering Explorer - 0 views

  •  
    階層型クラスタリングを眺めるためのユーザインタフェイス
Ken Wakita

OAIHarvester2 - 0 views

  •  
    OAI v 2.0 プロトコルに対応した OAI Harvester の Java 実装。
Ken Wakita

CHB-MIT Scalp EEG Database - 0 views

  •  
    @koh_t から教えていただいた巨大脳波データ。 脳波データには EEG 形式と MEG 形式があるらしい。当方は分析よりもデータの提供方法に関心があります。
Ken Wakita

MapReduceのJava実装Apache Hadoopを使ってみた (1/3) - @IT - 0 views

  •  
    Hadoop の入門記事
Ken Wakita

Welcome to Neurotycho! | neurotycho.org - 0 views

shared by Ken Wakita on 21 May 11 - No Cached
  •  
    藤井くんがティコブラーエに捧げる,オープンソース脳神経科学情報のサイト.
Ken Wakita

Wikipedia database download - 0 views

  •  
    Wikipedia のデータベースはここからダウンロードできます.
Ken Wakita

p7zip - Browse Files at SourceForge.net - 0 views

  •  
    Windows で開発された高圧縮アーカイブ形式の 7z を UNIX などで利用できるようにするソフトウェア群です.p7zip はコマンド行から利用するもの,J7Zip は Java のための API のようです.
Ken Wakita

英語版 Wikipedia をダンプしたデータ一覧 - 1 views

  • enwiki-latest-pages-meta-history.xml.bz2
    • Ken Wakita
       
      これが記事の更新を一括ダウンロードするためのファイル.ただし,320GB もあるので注意しましょう.このファイルは xml.bz2 形式なのですが,実は xml.7z 形式の方がかなり圧縮率が高いので,ダウンロードにかかる時間も 1/10 ほどになりそうです.残念ながら 7z 形式の一括ダウンロードファイルはないので,meta-history[0-9]+.xml.7z をダウンロードするしかありません.  ところで,当初は高見くんに Windows で動作する高速なダウンロード用のツールを探してもらったのですが,なんと Chrome のダウンロードが速いです.
    • Ken Wakita
       
      ダウンロードすべきファイルに関するコメントを書きました.
  • enwiki-latest-all-titles-in-ns0.gz
    • Ken Wakita
       
      記事のタイトルに関するデータらしい
  • ...2 more annotations...
  • enwiki-latest-page.sql.gz
    • Ken Wakita
       
      最新版のページのデータ.編集履歴は含まれていないと思います.
  • enwiki-latest-pagelinks.sql.gz
    • Ken Wakita
       
      最新版のスナップショットにおける記事間のリンク関係.データは記事 ID 間のリンクになっているのだけど,記事 ID と記事のタイトルの関連性が不明です.どこか探せばわかるんだろうけれど.
  •  
    なんと...ダウンロードツールで探してみて、2~3年くらい前の記事ばっかりだったので、今はわざわざツールは使わないみたいですね。
Ken Wakita

BinaryParser - Binary File Parsing revisited using Javascript | Vjeux - 1 views

  •  
    JavaScript でバイナリデータにアクセスするためのツールが公開された.なんか,大谷くんが作っているシステムに酷似しているような...要チェック.
Ken Wakita

http://isl.ifit.uni-klu.ac.at/ - 0 views

  •  
    以下の二つの論文で扱われたデータセット。やはり、因子分析に向いたものとしてしましまさんから久保山さんにお薦めがありました。 -- M. Zanker, M.Jessenitschnig, D. Jannach and S. Gordea, Comparing Recommendation Strategies in a Commercial Context, IEEE Intelligent Systems, 2007, vol. 22, May/June. -- M. Zanker, M.Jessenitschnig, Collaborative feature-combination recommender exploiting explicit and implicit user feedback, 11th IEEE Conference on Commerce and Enterprise Computing (CEC), Vienna, Austria, 2009.
Ken Wakita

Amazon.com: Netlab (9781852334406): Ian T. Nabney: Books - 0 views

  •  
    これが、PRML の姉妹本の Matlab 実習編かな?Kindle ready らしい。
Ken Wakita

統数研:乱数取得サービス - 0 views

  •  
    しましまさん、呟く「ちなみに,すご〜く厳密な物理乱数が欲しいときは統数研の乱数取得サービス(=ココ)とかまで使わないといけません」
Ken Wakita

ORM is an anti-pattern | Seldo.Com Blog - 0 views

  •  
    RDB に対する OR mapping を使おうなどと思ったときには読み返すべし.
1 - 20 of 22 Next ›
Showing 20 items per page