文字コード変換ライブラリICUの紹介

■はじめに まずはじめに、「文字化けとは何か」と聞かれたらあなたは何と答えますか。それは、 日本に生を受けたプログラマが背負う宿命的な問題 と私なら答えるでしょう。(何、この冒頭w)皆さん、Webページ制作の経験があったり、自然言語処理をかじった…

GDD2011, DevQuizのスライドパズルの解答コードを公開しました

去年の話になりますが、Google Developer Day 2011(GDD2011)に参加するために、DevQuizに挑戦しました。 お分かりの通り、開催されてから1年以上は経っているのですが、つい最近になって探索アルゴリズムの復習でもしようと思って(研究とは全く関係ない…)、…

ドラえもん生誕100年前記念 〜現在と未来のひみつ道具の比較〜(後編)

ようやくこのタイトルでの話も後編を迎えることになりました。 今回は最後の11個について紹介していきます。 ■エスパーキャップ ・現在のエスパーキャップ(脳コントローラー)ユーザーの脳波を読み取るヘッドセット。現時点で既に念じるだけで、仮想物質を動…

ドラえもん生誕100年前記念 〜現在と未来のひみつ道具の比較〜(中編)

前編では、33個あるひみつ道具のうち、最初の11個について紹介してきました。その時には見つけたひみつ道具をマイポケットにしまってコレクションできるとお話しましたが、実はひみつ道具を10個集めると特別なアイテム「ほんやくコンニャク」が貰えます。こ…

ドラえもん生誕100年前記念 〜現在と未来のひみつ道具の比較〜(前編)

ミクの5歳の誕生日の歓喜の余韻が冷め止まぬ内にドラえもんの−100歳の誕生日がやってきました。Googleでは、ドラえもんの生誕100年前を記念して、みらいサーチ(http://www.miraisearch.jp)というスマートフォン向けの面白そうなサービスを公開したようです。…

FOBOSを実装してみた(理論編)

■概要 利用可能な言語資源(Wikipedia, GSK Corpus, Google N-gram Corpusなど)が急激に拡大してきており、これに伴ってより多くの言語データを扱えるようになったことで統計的機械翻訳の翻訳精度は急激に上昇してきています。一方で,大量に保存されてきた言…

Sony GO FOR IT 5) 申告制エレベータ

就活のためエントリーしていたSonyから「コードで世界を変えたいと思う方、現実の難しい課題をプログラミングによって解くことが好きな方向けに『GO FOR IT -コードで世界は変えられる-』を開催します。」と題して以下のサイトでイベントを行なっているとい…

Tarzan 2011 11/24号 睡眠&入浴

以下は、「Tarzan 2011 11/24号 睡眠&入浴」を参考にして「快眠」について書いたものです。 (ちなみに去年も同じようなタイトルで特集していた。)■はじめに とある勉強会の会場で、何やら気になる特集をしていたこの雑誌を見つけたのがきっかけで、睡眠のメ…

MacでSRILMを利用してGoogle N-gramから言語モデルを作成する

N-gram言語モデルを学習するツールとして有名なSRILMをMacにインストールして、さらにGoogle N-gramを使って言語モデルを作成してみました。■SRILMについて SRILM(The SRI Language Modeling Toolkit)は、統計的言語モデルの学習ツールとして主に音声認識、…

svnとgitのコマンド比較

配属された研究室あるいは職場などで共同作業をする時に、svnやgitなどのバージョン管理システム(Version Control System:VCS)を使う機会が多くなると思います。最近では、Googleをはじめ多くの企業が大規模プロジェクトでgitによるVCSを採用しており、svnか…

SMS/MMSアプリとメールアプリの違いと使い分け

10月14日にiPhone4Sが発売されて初めてスマートフォンに乗り換えたという方が多いのではないでしょうか。 iPhoneには「SMS/MMS」と「メール」の2つのアプリケーションが標準搭載されていて、まだ操作に慣れていない多くのiPhoneユーザ(自分もだけど)が戸惑…

MacPortsでよく使う覚えておきたいコマンド一覧

ブログの更新がかなり遅れてしまいました。すみません。 最初の1回目は何について書こうかあれこれ迷っている内にいつの間にか時間だけが過ぎてました(汗) 取り敢えず適当に何か書いてみようと思い、「MacPortsでよく使う覚えておきたいコマンド一覧」という…

ブログはじめました!

単なる気まぐれでブログはじめました。 単なる気まぐれでやめるかもしれませんが…