日本語形態素解析(字句解析)用のAPIをリリースしました

| カテゴリ:Web・IT

スクリーンショット

開発者向けに形態素解析(字句解析)用APIをリリースしました。

日本語形態素解析API■140note

その名前の通り、日本語の形態素解析を行うAPIです。
文章を最小単位の言葉で分割します。


表層形、品詞、品詞細分類、活用形、活用型、原形、読み等を返します。
詳しい仕様はAPIの説明ページでご確認ください。
その場で試してみることもできます。


形態素解析エンジンはMeCab(和布蕪)です。辞書はIPAdic並びにWikipediaのデータを元としたユーザー辞書を用いています。


まだまだ納得いく結果は返してくれないですが、今後徐々に改善して、少しはマシに……。


140noteにて使用する目的で作られたAPIではありますが、本APIそのものとTwitterはまったく関係ありません。


よければご活用ください。


以下、本APIを作った経緯等。


140noteの人気コンテンツであるあなたの恋人等では形態素解析のためにYahoo!デベロッパーネットワークのAPIを用いています。
(無料で使える上に制限も緩く、とても素晴らしいAPIです!)


YahooのAPIそのものにはまったく不満がないのですが、ただ、自前で形態素解析ができるようにしたいということは前から考えていました。
無料サービスに頼りすぎるのはリスクがあるので。


それで140note用に形態素解析を用意しまして、せっかく作ったのだから一般に公開してしまおうかなと。


なにかあれば私のTwitterアカウントにでも気軽に連絡ください。

概要

青春B運営メンバー多口カタンによる雑記blogです。
自己紹介はこちら。開発物をまとめたものはこちら
 
ヘッダーイラストはkojiさん制作です。
感想・意見・要望等ありましたら気軽にフォームにてコンタクトくださいませ。
 
Twitterはじめましたので誰でも気軽に声かけてくださいね。