今日、ふと次のようなタイムラインが流れてきた。
https://twitter.com/abidlabs/status/1412826272770793474?s=20
ようは、たった6行でアラビア語の文章を要約文にできるというもの。
gradioというパッケージはよくしらないが、どうもモデル自体をリポジトリからロードしているようだ。
とすると、arという文字列をjaにすれば、日本語の要約サンプルがかけるんじゃ..とおもい Google Corab 上でためしてみた。
!pip install gradio
import gradio as gr
from gradio.mix import Series
ja2en = gr.Interface.load("Helsinki-NLP/opus-mt-ja-en", src="huggingface", inputs="textbox")
summarizer = gr.Interface.load("facebook/bart-large-cnn", src="huggingface")
en2jap = gr.Interface.load("Helsinki-NLP/opus-mt-en-jap", src="huggingface")
Series(ja2en, summarizer, en2jap).launch(debug=True)
結局置換( s/ar/ja/g )では動作しなくて英語から日本語にするときのラベルは上記のようにjapと書かないとだめだった。
..物議をかもしそうなラベル名だけど..まあ、ここでは華麗に無視をして..
で、何を試そうかな..とおもい次の記事をコピペしてSubmitしてみた。
- LivedoorNews: 新宿駅前に出現した「巨大ネコ」の街頭ビジョン 「時代の流れを感じます」
- https://news.livedoor.com/article/detail/20495374/
..で、結果は..
日 が 暮れ る と , 人 が 眠 る こと な く , 夜 が 眠 っ て い る 時 , その 熟練 な 人々 の 前 に 置 か れ る . これ は 突陽 を 失 お う と する 事 で あ っ て , 日 が 暗 く な る の を 見 た . しかし これ は 幻 を 見 る こと が でき な い .
..コレジャナイ感満載..
それこそ昔 Seaquence2Sequence で試したときのアウトプットのような文章が..
..有料サービスで提供している企業もあるわけだし..
..まあ、そんなかんたんにつくれるわけないか...
でも、gradio というPythonパッケージはおもしろそう。
以下トップページの文章(翻訳):
Gradioを使用すると TensorFlow モデルや PyTorch モデル、さらには任意のPython関数を中心にカスタマイズ可能なUIコンポーネントをすばやく作成できます。コンポーネントを組み合わせて、任意の入力と出力をサポートします。Gradio コアライブラリは無料で OSSです
ちょっとおぼえておくと、いいかも..
0 件のコメント:
コメントを投稿