Group items tagged data - SmartGuys

Pajek data: Corporate interlocks in Scotland (1904-5). - 0 views

vlado.fmf.uni-lj.si/...scotland.htm

shared by Ken Wakita on 31 Mar 09 - Cached

- Ken Wakita on 31 Mar 09
  
  鈴木くん、ハイライトしたところを読んでおいて！
  
  <div class="cArrow"> </div><div class="cContentInner">鈴木くん、ハイライトしたところを読んでおいて！</div>
  
  ...
  
  Cancel
...

Cancel

Data Sets | GroupLens Research - 0 views

www.grouplens.org/...14

data mining statistics research

shared by Ken Wakita on 05 Aug 09 - Cached

Ken Wakita on 05 Aug 09

協調フィルタリングで有名な GroupLens グループのデータセット。 -- しましまさんから久保山さんに因子分析に都合がよいデータとして呟かれた情報より

<div class="cArrow"> </div><div class="cContentInner">協調フィルタリングで有名な GroupLens グループのデータセット。 -- しましまさんから久保山さんに因子分析に都合がよいデータとして呟かれた情報より</div>

...

Cancel

What are cross-validation and bootstrapping? - 0 views

www.faqs.org/...section-12.html

research data

shared by Ken Wakita on 04 Jun 09 - Cached

k-fold cross-validation
- Ken Wakita on 05 Jun 09
  
  LOO は k-fold の一種 LVO は k-fold をはずれる気がする。
  
  <div class="cArrow"> </div><div class="cContentInner">LOO は k-fold の一種 LVO は k-fold をはずれる気がする。</div>
  
  ...
  
  Cancel
...

Cancel
Leave-v-out
...

Cancel
leave-one-out
...

Cancel
...4 more annotations...
hold-out
- Ken Wakita on 05 Jun 09
  
  cross-validation と hold-out はしばしば混同されるけれども前者の方がはるかに優れている点については、文献リストの Goutte (1997) が述べているそうだ。
  
  <div class="cArrow"> </div><div class="cContentInner">cross-validation と hold-out はしばしば混同されるけれども前者の方がはるかに優れている点については、文献リストの Goutte (1997) が述べているそうだ。</div>
  
  ...
  
  Cancel
...

Cancel
Goutte, C. (1997)
- Ken Wakita on 05 Jun 09
  
  cross-validation is markedly superior for small data sets; this fact is demonstrated dramatically by Goutte (1997) in a reply to Zhu and Rohwer (1996)
  
  <div class="cArrow"> </div><div class="cContentInner">cross-validation is markedly superior for small data sets; this fact is demonstrated dramatically by Goutte (1997) in a reply to Zhu and Rohwer (1996)</div>
  
  ...
  
  Cancel
...

Cancel
Jackknifing
...

Cancel
the probability of selecting the "best" does not converge to 1 (as the sample size n goes to infinity) for leave-v-out cross-validation unless the proportion v/n approaches 1
...

Cancel

Ken Wakita on 04 Jun 09

Leave one out cross validation is asymptotically equivalent to AIC. (LOO が漸近的に AIC と一致すること)について豊田さんが呟いて教えてくれた。

<div class="cArrow"> </div><div class="cContentInner">Leave one out cross validation is asymptotically equivalent to AIC. (LOO が漸近的に AIC と一致すること)について豊田さんが呟いて教えてくれた。</div>

...

Cancel

SUSHI Preference Data Set - 0 views

www.kamishima.net/sushi

research data mining statistics

shared by Ken Wakita on 05 Aug 09 - Cached

Ken Wakita on 05 Aug 09

寿司ネタの嗜好についてのデータセット -- しましまさんのデータです。使うときには、感謝の気持ちを込めて彼に呟いてあげましょう。

<div class="cArrow"> </div><div class="cContentInner">寿司ネタの嗜好についてのデータセット -- しましまさんのデータです。使うときには、感謝の気持ちを込めて彼に呟いてあげましょう。</div>

...

Cancel

Collaborative filtering dataset - dating agency - 0 views

www.occamslab.com/data

data research statistics mining

shared by Ken Wakita on 05 Aug 09 - Cached

Ken Wakita on 05 Aug 09

出会い系サイトで収集されたマッチングデータ -- 17,359,346 anonymous ratings of 168,791 profiles made by 135,359 LibimSeTi users as dumped on April 4, 2006

<div class="cArrow"> </div><div class="cContentInner">出会い系サイトで収集されたマッチングデータ -- 17,359,346 anonymous ratings of 168,791 profiles made by 135,359 LibimSeTi users as dumped on April 4, 2006</div>

...

Cancel

AudioScrobbler Data - 0 views

www-etud.iro.umontreal.ca/...audioscrobbler_data.html

data mining statistics music

shared by Ken Wakita on 05 Aug 09 - Cached

Ken Wakita on 05 Aug 09

しましまさんから久保山さんにお薦めにあったデータセット。LastFM の過去のデータがパブリックドメインとして提供されています。現在は、このようなデータは公開されていないようです。

<div class="cArrow"> </div><div class="cContentInner">しましまさんから久保山さんにお薦めにあったデータセット。LastFM の過去のデータがパブリックドメインとして提供されています。現在は、このようなデータは公開されていないようです。</div>

...

Cancel

Snow Leopard Bug Responsible for Loss of User Data Gaining Notice [Updated] - Mac Rumors - 1 views

www.macrumors.com/...ss-of-user-data-gaining-notice

mac hack

shared by Ken Wakita on 14 Oct 09 - Cached

Ken Wakita on 14 Oct 09

ゲストアカウントを使用している人は Snow Leopard へのアップグレードでデータを丸ごと失うかもしれないそうです。予めゲストアカウントの利用を中止してから、アップグレードし、そこでゲストアカウントを開始するのは安全みたいです。

<div class="cArrow"> </div><div class="cContentInner">ゲストアカウントを使用している人は Snow Leopard へのアップグレードでデータを丸ごと失うかもしれないそうです。予めゲストアカウントの利用を中止してから、アップグレードし、そこでゲストアカウントを開始するのは安全みたいです。</div>

...

Cancel

HCE - Hierarchical Clustering Explorer - 0 views

www.cs.umd.edu/hce

data research

shared by Ken Wakita on 07 Jun 12 - No Cached

Ken Wakita on 07 Jun 12

階層型クラスタリングを眺めるためのユーザインタフェイス

<div class="cArrow"> </div><div class="cContentInner">階層型クラスタリングを眺めるためのユーザインタフェイス</div>

...

Cancel

OAIHarvester2 - 0 views

www.oclc.org/...harvester2.htm

java library data

shared by Ken Wakita on 24 Jun 10 - No Cached

Ken Wakita on 24 Jun 10

OAI v 2.0 プロトコルに対応した OAI Harvester の Java 実装。

<div class="cArrow"> </div><div class="cContentInner">OAI v 2.0 プロトコルに対応した OAI Harvester の Java 実装。</div>

...

Cancel

CHB-MIT Scalp EEG Database - 0 views

www.physionet.org/chbmit

data research

shared by Ken Wakita on 25 Nov 10 - No Cached

Ken Wakita on 25 Nov 10

@koh_t から教えていただいた巨大脳波データ。脳波データには EEG 形式と MEG 形式があるらしい。当方は分析よりもデータの提供方法に関心があります。

<div class="cArrow"> </div><div class="cContentInner">@koh_t から教えていただいた巨大脳波データ。脳波データには EEG 形式と MEG 形式があるらしい。当方は分析よりもデータの提供方法に関心があります。</div>

...

Cancel

MapReduceのJava実装Apache Hadoopを使ってみた (1/3) - @IT - 0 views

www.atmarkit.co.jp/...distributed03_1.html

tutorial java data

shared by Ken Wakita on 11 Feb 11 - Cached

Ken Wakita on 11 Feb 11

Hadoop の入門記事

<div class="cArrow"> </div><div class="cContentInner">Hadoop の入門記事</div>

...

Cancel

Welcome to Neurotycho! | neurotycho.org - 0 views

neurotycho.org

research data

shared by Ken Wakita on 21 May 11 - No Cached

Ken Wakita on 21 May 11

藤井くんがティコブラーエに捧げる，オープンソース脳神経科学情報のサイト．

<div class="cArrow"> </div><div class="cContentInner">藤井くんがティコブラーエに捧げる，オープンソース脳神経科学情報のサイト．</div>

...

Cancel

Wikipedia database download - 0 views

en.wikipedia.org/...Wikipedia:Database_download

data complex

shared by Ken Wakita on 17 Jun 11 - Cached

Ken Wakita on 17 Jun 11

Wikipedia のデータベースはここからダウンロードできます．

<div class="cArrow"> </div><div class="cContentInner">Wikipedia のデータベースはここからダウンロードできます．</div>

...

Cancel

p7zip - Browse Files at SourceForge.net - 0 views

sourceforge.net/...files

data tool

shared by Ken Wakita on 17 Jun 11 - No Cached

Ken Wakita on 17 Jun 11

Windows で開発された高圧縮アーカイブ形式の 7z を UNIX などで利用できるようにするソフトウェア群です．p7zip はコマンド行から利用するもの，J7Zip は Java のための API のようです．

<div class="cArrow"> </div><div class="cContentInner">Windows で開発された高圧縮アーカイブ形式の 7z を UNIX などで利用できるようにするソフトウェア群です．p7zip はコマンド行から利用するもの，J7Zip は Java のための API のようです．</div>

...

Cancel

英語版 Wikipedia をダンプしたデータ一覧 - 1 views

dumps.wikimedia.org/latest

research data complex

shared by Ken Wakita on 17 Jun 11 - No Cached

enwiki-latest-pages-meta-history.xml.bz2
- Ken Wakita on 17 Jun 11
  
  これが記事の更新を一括ダウンロードするためのファイル．ただし，320GB もあるので注意しましょう．このファイルは xml.bz2 形式なのですが，実は xml.7z 形式の方がかなり圧縮率が高いので，ダウンロードにかかる時間も 1/10 ほどになりそうです．残念ながら 7z 形式の一括ダウンロードファイルはないので，meta-history[0-9]+.xml.7z をダウンロードするしかありません．　ところで，当初は高見くんに Windows で動作する高速なダウンロード用のツールを探してもらったのですが，なんと Chrome のダウンロードが速いです．
  
  <div class="cArrow"> </div><div class="cContentInner">これが記事の更新を一括ダウンロードするためのファイル．ただし，320GB もあるので注意しましょう．このファイルは xml.bz2 形式なのですが，実は xml.7z 形式の方がかなり圧縮率が高いので，ダウンロードにかかる時間も 1/10 ほどになりそうです．残念ながら 7z 形式の一括ダウンロードファイルはないので，meta-history[0-9]+.xml.7z をダウンロードするしかありません．　ところで，当初は高見くんに Windows で動作する高速なダウンロード用のツールを探してもらったのですが，なんと Chrome のダウンロードが速いです．</div>
  
  ...
  
  Cancel
...

Cancel
- Ken Wakita on 17 Jun 11
  
  ダウンロードすべきファイルに関するコメントを書きました．
  
  <div class="cArrow"> </div><div class="cContentInner">ダウンロードすべきファイルに関するコメントを書きました．</div>
  
  ...
  
  Cancel
...

Cancel
enwiki-latest-all-titles-in-ns0.gz
- Ken Wakita on 17 Jun 11
  
  記事のタイトルに関するデータらしい
  
  <div class="cArrow"> </div><div class="cContentInner">記事のタイトルに関するデータらしい</div>
  
  ...
  
  Cancel
...

Cancel
...2 more annotations...
enwiki-latest-page.sql.gz
- Ken Wakita on 17 Jun 11
  
  最新版のページのデータ．編集履歴は含まれていないと思います．
  
  <div class="cArrow"> </div><div class="cContentInner">最新版のページのデータ．編集履歴は含まれていないと思います．</div>
  
  ...
  
  Cancel
...

Cancel
enwiki-latest-pagelinks.sql.gz
- Ken Wakita on 17 Jun 11
  
  最新版のスナップショットにおける記事間のリンク関係．データは記事 ID 間のリンクになっているのだけど，記事 ID と記事のタイトルの関連性が不明です．どこか探せばわかるんだろうけれど．
  
  <div class="cArrow"> </div><div class="cContentInner">最新版のスナップショットにおける記事間のリンク関係．データは記事 ID 間のリンクになっているのだけど，記事 ID と記事のタイトルの関連性が不明です．どこか探せばわかるんだろうけれど．</div>
  
  ...
  
  Cancel
...

Cancel

anonymous on 17 Jun 11

なんと...ダウンロードツールで探してみて、2~3年くらい前の記事ばっかりだったので、今はわざわざツールは使わないみたいですね。

<div class="cArrow"> </div><div class="cContentInner">なんと...ダウンロードツールで探してみて、2~3年くらい前の記事ばっかりだったので、今はわざわざツールは使わないみたいですね。</div>

...

Cancel

BinaryParser - Binary File Parsing revisited using Javascript | Vjeux - 1 views

blog.vjeux.com/...-unleash-javascript-power.html

research tool data javascript

shared by Ken Wakita on 08 Sep 11 - No Cached

Ken Wakita on 08 Sep 11

JavaScript でバイナリデータにアクセスするためのツールが公開された．なんか，大谷くんが作っているシステムに酷似しているような．．．要チェック．

<div class="cArrow"> </div><div class="cContentInner">JavaScript でバイナリデータにアクセスするためのツールが公開された．なんか，大谷くんが作っているシステムに酷似しているような．．．要チェック．</div>

...

Cancel

http://isl.ifit.uni-klu.ac.at/ - 0 views

isl.ifit.uni-klu.ac.at

data mining statistics research

shared by Ken Wakita on 05 Aug 09 - Cached

Ken Wakita on 05 Aug 09

以下の二つの論文で扱われたデータセット。やはり、因子分析に向いたものとしてしましまさんから久保山さんにお薦めがありました。 -- M. Zanker, M.Jessenitschnig, D. Jannach and S. Gordea, Comparing Recommendation Strategies in a Commercial Context, IEEE Intelligent Systems, 2007, vol. 22, May/June. -- M. Zanker, M.Jessenitschnig, Collaborative feature-combination recommender exploiting explicit and implicit user feedback, 11th IEEE Conference on Commerce and Enterprise Computing (CEC), Vienna, Austria, 2009.

<div class="cArrow"> </div><div class="cContentInner">以下の二つの論文で扱われたデータセット。やはり、因子分析に向いたものとしてしましまさんから久保山さんにお薦めがありました。 -- M. Zanker, M.Jessenitschnig, D. Jannach and S. Gordea, Comparing Recommendation Strategies in a Commercial Context, IEEE Intelligent Systems, 2007, vol. 22, May/June. -- M. Zanker, M.Jessenitschnig, Collaborative feature-combination recommender exploiting explicit and implicit user feedback, 11th IEEE Conference on Commerce and Enterprise Computing (CEC), Vienna, Austria, 2009.</div>

...

Cancel

Amazon.com: Netlab (9781852334406): Ian T. Nabney: Books - 0 views

www.amazon.com/...1852334401

data mining research book

shared by Ken Wakita on 29 Jul 09 - No Cached

Ken Wakita on 29 Jul 09

これが、PRML の姉妹本の Matlab 実習編かな？Kindle ready らしい。

<div class="cArrow"> </div><div class="cContentInner">これが、PRML の姉妹本の Matlab 実習編かな？Kindle ready らしい。</div>

...

Cancel

統数研：乱数取得サービス - 0 views

random.ism.ac.jp/random

data server research statistics

shared by Ken Wakita on 05 Jun 09 - Cached

Ken Wakita on 05 Jun 09

しましまさん、呟く「ちなみに，すご〜く厳密な物理乱数が欲しいときは統数研の乱数取得サービス（＝ココ）とかまで使わないといけません」

<div class="cArrow"> </div><div class="cContentInner">しましまさん、呟く「ちなみに，すご〜く厳密な物理乱数が欲しいときは統数研の乱数取得サービス（＝ココ）とかまで使わないといけません」</div>

...

Cancel

ORM is an anti-pattern | Seldo.Com Blog - 0 views

seldo.com/...orm_is_an_antipattern

data development programming

shared by Ken Wakita on 21 Jun 11 - No Cached

Ken Wakita on 21 Jun 11

RDB に対する OR mapping を使おうなどと思ったときには読み返すべし．

<div class="cArrow"> </div><div class="cContentInner">RDB に対する OR mapping を使おうなどと思ったときには読み返すべし．</div>

...

Cancel

Group items tagged

Pajek data: Corporate interlocks in Scotland (1904-5). - 0 views

Data Sets | GroupLens Research - 0 views

What are cross-validation and bootstrapping? - 0 views

SUSHI Preference Data Set - 0 views

Collaborative filtering dataset - dating agency - 0 views

AudioScrobbler Data - 0 views

Snow Leopard Bug Responsible for Loss of User Data Gaining Notice [Updated] - Mac Rumors - 1 views

HCE - Hierarchical Clustering Explorer - 0 views

OAIHarvester2 - 0 views

CHB-MIT Scalp EEG Database - 0 views

MapReduceのJava実装Apache Hadoopを使ってみた (1/3) - @IT - 0 views

Welcome to Neurotycho! | neurotycho.org - 0 views

Wikipedia database download - 0 views

p7zip - Browse Files at SourceForge.net - 0 views

英語版 Wikipedia をダンプしたデータ一覧 - 1 views

BinaryParser - Binary File Parsing revisited using Javascript | Vjeux - 1 views

http://isl.ifit.uni-klu.ac.at/ - 0 views

Amazon.com: Netlab (9781852334406): Ian T. Nabney: Books - 0 views

統数研：乱数取得サービス - 0 views

ORM is an anti-pattern | Seldo.Com Blog - 0 views

Related searches