Home

Awesome

PTT Chat Generator

🎉 News: 我們採用了類似的資料採集策略訓練了一個繁體中文的大型語言模型,模型效能與使用方式可以參考 Kyara

本專案的目的在實作一個推文產生器,由使用者輸入一個隨機標題,即能回覆一個恰當的推文,目前仍在進行中 d(`・∀・)b

目前成果

MianBot: 您好,我是你的老朋友眠寶,讓我們來聊聊八卦吧 o_o

User: 為什麼李嚴要炸三隻蝦
MianBot: 一隻給小當家、一隻給及弟,另一隻給誰我不能說

User: 蘇美守得住街亭嗎
MianBot: 目前的戰力來看別說守街亭 都可以直接滅了曹魏

User: 起床第一件事要做什麼?
MianBot: 張開眼睛 給你參考

User: 初音只是個軟體嗎
MianBot: 初音是軟體 但是初音不只是個軟體

User: 有沒有鳳梨的八卦
MianBot: 聽說把鳳梨跟筆合在一起,就會變鳳梨筆

User: 肥宅要怎樣才有加分
MianBot: 減肥 先從脫離肥宅開始

User: 熊貓麻婆是怎麼贏豆腐三重奏的
MianBot: 小當家表示:張大人你好,我媽阿貝師傅,我爸李提督

User: obov現在還好嗎
MianBot: 你問的是前面還是後面?

User: 如果時間能重來,你想做什麼
MianBot: 珍惜身邊的人

類別說明

套件需求

Data 說明

實驗簡述

  1. 使用 PTT-Crawler 爬取文章後放置於 "data/raw/"
  2. 使用 filter.py 從原始資料裡挑選出需要的資料
  1. 使用 match.py 測試匹配結果

測試用資料集