Skip to main content

Home/ SmartGuys/ Group items tagged Wikipedia

Rss Feed Group items tagged

Ken Wakita

Wikipedia:Size of Wikipedia - Wikipedia - 0 views

  •  
    Wikipedia の規模の変遷についての統計
Yuma Mizutani

Zero Geography: Wikipedia Article Quality in East Asia - 1 views

  •  
    英語版Wikipediaのアジア圏内地域情報を含む記事の件数をVisualiseしたもの.
anonymous

Wikipedia-Lab - 0 views

  •  
    wikipedia研究所のHP。
Ken Wakita

Export pages - Wikipedia - 0 views

  •  
    Wikipediaページの過去1,000編集履歴を取得するためのウェブページ。真面目に使うなら、このページでも参照されている Special:Export のウェブ API を利用しましょう。
Yuma Mizutani

英語版 Wikipedia 内の日本関連記事数、東アジアの他国を圧倒 - インターネットコム - 1 views

  •  
    英語版 Wikipedia 内に記載された東アジア各国(日本、台湾、韓国、北朝鮮、中国東部)の地域情報についての調査に関するNews記事.
anonymous

Wikipediaのダウンロードできるデータファイル一覧 - 2 views

  •  
    wikipediaのデータ構造
Ken Wakita

Wikipedia database download - 0 views

  •  
    Wikipedia のデータベースはここからダウンロードできます.
Ken Wakita

graphipedia: Creates a Neo4j graph of Wikipedia links. - 0 views

  •  
    Javaを用いて作成したプロジェクト。Neo4j graph database に Wikipedia のリンクグラフを読み込んで簡単な実験を実施している。
Ken Wakita

Theory of Forms - 0 views

  •  
    Smalltalk@Wikipedia から流れついた項目。プラトンのイデア論と関連があるのか?Inheritance と Prototyping との関係について考察する素材になりそう。
Ken Wakita

英語版 Wikipedia をダンプしたデータ一覧 - 1 views

  • enwiki-latest-pages-meta-history.xml.bz2
    • Ken Wakita
       
      これが記事の更新を一括ダウンロードするためのファイル.ただし,320GB もあるので注意しましょう.このファイルは xml.bz2 形式なのですが,実は xml.7z 形式の方がかなり圧縮率が高いので,ダウンロードにかかる時間も 1/10 ほどになりそうです.残念ながら 7z 形式の一括ダウンロードファイルはないので,meta-history[0-9]+.xml.7z をダウンロードするしかありません.  ところで,当初は高見くんに Windows で動作する高速なダウンロード用のツールを探してもらったのですが,なんと Chrome のダウンロードが速いです.
    • Ken Wakita
       
      ダウンロードすべきファイルに関するコメントを書きました.
  • enwiki-latest-all-titles-in-ns0.gz
    • Ken Wakita
       
      記事のタイトルに関するデータらしい
  • ...2 more annotations...
  • enwiki-latest-page.sql.gz
    • Ken Wakita
       
      最新版のページのデータ.編集履歴は含まれていないと思います.
  • enwiki-latest-pagelinks.sql.gz
    • Ken Wakita
       
      最新版のスナップショットにおける記事間のリンク関係.データは記事 ID 間のリンクになっているのだけど,記事 ID と記事のタイトルの関連性が不明です.どこか探せばわかるんだろうけれど.
  •  
    なんと...ダウンロードツールで探してみて、2~3年くらい前の記事ばっかりだったので、今はわざわざツールは使わないみたいですね。
Ken Wakita

Home - MongoDB - 0 views

  •  
    文書処理を主要なターゲットとしたデータベース.複雑なトランザクション処理には向かないが,小さな読み書きが大量に発生する処理が得意.文書アーカイブやイベントログなどに用いられる. Wikipedia のアーカイブに利用できるか?
Ken Wakita

ネット百科事典コトバンク - 0 views

shared by Ken Wakita on 22 Apr 09 - Cached
  •  
    以下、ITmedia News の評です: 朝日新聞社、講談社、小学館などが辞書コンテンツを持ち寄り、無料の辞書サイト「kotobank」をオープンする。信頼性の高い無料辞書サイトとしてWikipediaに対抗する。
mana ten

Ternary operation - Wikipedia, the free encyclopedia - 0 views

  •  
    三項演算子は日本人が勝手に付けた名前だと思ってたら違ったのでブックマーク。
Ken Wakita

Wikipediaの大量データをMySQLに保存する - Qiita - 0 views

  • $ mysql -u root jawikipedia < jawiki-latest-page.sql $ mysql -u root jawikipedia < jawiki-latest-pagelinks.sql $ mysql -u root jawikipedia < jawiki-latest-categorylinks.sql
  • jawiki-latest-pagelinks.sqlは・・・8時間くらい。途中PCがスリープになっていたので本当はもっと早かったかもしれません。
  • ページのカテゴリの一覧
Ken Wakita

Optical flow - 0 views

  •  
    先日、下平先生ご自身が Processing を使って実装されたという Optical Flow のデモを見せていただきました。PC 内蔵のビデオカメラで撮影される映像を実時間で処理して、画面のなかの動きを捉えるデモでした。画面中の仮想的な風船で遊ぶことができました。今度、自作してみよっと。
Ken Wakita

Index of /enwiki/latest/ - 0 views

  •  
    英語版データベース一式のありか。常に最新版がここに保存されていますが、ときどきダンプ作業中のこともあるので注意を要します。
Ken Wakita

Manual:Parameters to Special:Export - MediaWiki - 0 views

  •  
    Wikipeida のページの過去1,000版までの編集履歴をまとめてダウンロードできるらしい。特にカテゴリを設定し、それに含まれるすべてのページを取得できるらしい。
1 - 18 of 18
Showing 20 items per page