

→ jupei : 還不都中文 有差? 11/05 20:50
→ Skydier : 上次不是被抓包套皮中國的系統 11/05 20:55
推 physicsdk : 我不會說沒差,但既然簡中有優勢,就還是需要多參 11/05 20:58
→ physicsdk : 考求自己進步,不能為反而反 11/05 20:58
推 gino0717 : 除了政治話題外有什麼資料是繁中有簡中沒有的 11/05 21:03
推 a22222a4210 : 繁轉簡沒啥問題 簡轉繁很多字會轉不過來 11/05 21:08
噓 yunf : 這原本就是一個政治操作原本就只有2000多萬人口的產 11/05 21:10
→ yunf : 出要怎麼會多過13億人口的產出你可以說這是一個與愛 11/05 21:10
→ yunf : 發展的困境也可以說他根本就不是一個問題這個問題會 11/05 21:10
→ yunf : 產生完全是因為你選擇使用這樣的方向發展而不是使用 11/05 21:10
→ yunf : 一個量少質精的方向發展會遇到這種問題根本就是遲早 11/05 21:10
→ yunf : 的事別把大家都當白癡耍 11/05 21:11
→ yunf : 聰明的鄉民應該要去追溯這則新聞到底是誰出的還有誰 11/05 21:12
→ yunf : 決策這些東西發展的方向自然就會水落石出! 11/05 21:12
→ kevinmeng2 : 自由時報…呵呵,不演了? 11/05 21:35
推 guf60152 : AI本身就大數據 能贏我才覺得有鬼吧 11/05 21:36
→ kissmickey : 都抄的當然落後 11/05 22:06
推 ohohohya : 自己不累積啊 先出錢翻譯國外文件 11/05 22:21
噓 TISH12311 : 乾脆繁轉英還比較有用 11/05 22:26
推 j0958322080 : 中國連 stackoverflow 都翻成簡體了 11/05 22:33
噓 ccas : 等一下,中研院不是已經切割說是「個人研究」嗎? 11/05 22:46
→ ccas : 結果現在又開始出來說沾光? 11/05 22:46
推 BIOS : 簡中資源量一直都是屌打繁中.... 11/05 22:53
噓 chunfo : 台灣是全世界最鄙視翻譯的地方 11/05 22:54
推 rogergon : 當然有差,簡中LLM弄出來的用詞就是對岸的。 11/05 23:19
→ DrizztMon : 不是簡中是屌打繁中,但這樣世界各地其他國家怎麼辦 11/05 23:33
→ DrizztMon : 又不是被屌打就做不出來 11/05 23:33
推 gn01216674 : 理由伯 11/05 23:41
推 centra : 科技業不烙個英文單字就弱了 11/05 23:45
推 ciplu : 新聞現在都用水平了 沒在用水準 早就被統一 11/05 23:50
推 centra : 還不如花錢讓全國人民英語能力提升 11/05 23:50
→ ciplu : 連用詞都慢慢被同化 直接用簡轉繁訓練算了 11/05 23:51
推 gn01216674 : 上次還聽到新聞說「質量」....聽了搖頭 11/05 23:56
推 Lhmstu : 放棄吧,台灣不可能搞這個 11/05 23:58
推 Ron51320 : 所以數位部還在搞麵線嗎? 11/06 00:17
噓 lovebridget : 哦 要合理化直接爽抄中國又爽拿台灣經費了 11/06 00:17
推 lwamp : 就是找個藉口要錢啦,然後花了大錢又做一個垃圾出 11/06 00:19
→ lwamp : 來 11/06 00:19
→ lavign : 繁中資料集也只是ChatGPT的一點點而已 11/06 00:23
推 s1an : 不忍苛責CKIP 有問題的是沒搞懂又亂發新聞的人 11/06 00:47
推 crey : 兩千多萬人的資料產出想大於13億人?這數量差太多了 11/06 01:59
噓 HenryLin123 : 合理化支語仔行為 11/06 02:00
推 menesn : 對普通台灣人如我,最好的選擇就是把英文跟簡中都練 11/06 02:13
→ menesn : 繁中我不指望了 11/06 02:13
推 drakd4d : 人家有知乎,繁中有啥?Dcard幻想文?覺青廢文,還 11/06 06:05
→ drakd4d : 是白飯新聞? 11/06 06:05
→ drakd4d : 就沒什麼知識性的討論,人民也不愛看書,自己變弱勢 11/06 06:05
→ drakd4d : 文化怪誰? 11/06 06:05
→ drakd4d : AI剛好就是加速淘汰弱勢文化而已 11/06 06:05
推 drakd4d : Garbage in Garbage out 11/06 06:09
推 drakd4d : 最佳解法就是學新加坡變英語系國家,不然講中文逃不 11/06 06:11
→ drakd4d : 了 11/06 06:11
推 kimisawa : 馬的幹連谷歌繁中翻譯都被簡中污染 11/06 06:38
→ DrTech : 這根本是學者為了騙經費而說的話。google 搜尋引擎 11/06 07:12
→ DrTech : 搜到一堆簡體與政治立場不正確的資料,怎麼不自己研 11/06 07:12
→ DrTech : 發一套取代Google搜尋的工具? 怎麼不自己建立搜尋 11/06 07:12
→ DrTech : 引擎所需資料? 資料品質差,繁體中文資料較少,根 11/06 07:12
→ DrTech : 本不是最大的問題,不然政府與學者早就該研發繁體中 11/06 07:12
→ DrTech : 文搜尋引擎取代google了。 11/06 07:12
→ DrTech : 最大的問題是,連世界上最厲害的OpenAI與ChatGPT都 11/06 07:15
→ DrTech : 沒在分繁簡體知識或任何國籍語言,才會有好的效果。 11/06 07:15
→ DrTech : 政府與學者卻為了政治目的,違背科學原理,開倒車訓 11/06 07:16
→ DrTech : 練一個狹隘知識的模型。 11/06 07:16
→ DrTech : 防堵中國偏見言論,我贊同。但防堵簡體中文知識,完 11/06 07:18
→ DrTech : 全是違背科學原理的做法。 11/06 07:18
→ DrTech : 最簡單的做法其實是:不要排除簡體中文知識,但過濾 11/06 07:23
→ DrTech : 政治意圖資料,才是全世界研究LLM的主流做法。不信 11/06 07:23
→ DrTech : 可以去看各國論文。 11/06 07:23
→ DrTech : 另外,怎麼不說:"繁中資料量落後英文,不利台AI語 11/06 07:31
→ DrTech : 言模型呢?" 為了騙經費,政治目的,科學與邏輯都變 11/06 07:31
→ DrTech : 差了。 11/06 07:31
→ zzahoward : 因為沒能力去做AI篩選阿XDDD 11/06 08:13
噓 boom1227 : 真的有人信這種? 11/06 08:14
→ boom1227 : Ai模型會看不懂簡體? 11/06 08:14
→ ob962 : 少不一定不好 八卦這麼多真知灼見怎麼不拿來用 11/06 08:23
→ faniour : 簡中論壇的知識庫狂甩繁中10年以上 11/06 08:28
→ faniour : ptt跟本悲哀 11/06 08:29
→ Eriri : PTT一堆沒營養的資訊 沒什麼知識成分 然後嗆來嗆去 11/06 08:42
→ Eriri : 的 能有用才怪 11/06 08:42
推 suninrain : 其實查資料比較常查的是英文的,AI應該可以用台灣常 11/06 08:45
→ suninrain : 用搜尋語系做一個參考,不必侷限繁中跟簡中 11/06 08:46
→ suninrain : 不同行業的常用語言應該也會有蠻大的差異 11/06 08:47
推 Bugquan : 看有的推文就知道,為何繁中資料沒用 11/06 09:08
→ unima : 塔綠班課綱教出一堆沒文化中文奇爛無比的學生,跟人 11/06 09:45
→ unima : 家比什麼中文?! 11/06 09:45
推 physicsdk : 講得好像對岸的論壇就多有營養一樣,落後的問題才 11/06 09:49
→ physicsdk : 不在這 11/06 09:49
→ physicsdk : 要也是記者隨便抄ptt當新聞這種行為 11/06 09:50
推 blargelp : 滿慘的 人口太少只能用劣等文化的資料庫 11/06 09:53
推 gmoz : 因為AI經費都拿去發給顏色正確的接標案啊 嘻嘻 11/06 10:42
→ rogergon : 再不然就加個簡繁語彙關鍵字轉換外掛吧 11/06 10:58
推 yudofu : google只是搜尋,又不灌輸立場,跟語言模型比,笑死 11/06 11:02
推 DrTech : 語言模型只是計算,又不灌輸立場,跟搜尋引擎比,笑 11/06 11:55
→ DrTech : 死。 11/06 11:55
→ DrTech : 搜尋引擎的演算法與架構,絕對比語言模型更"不中立" 11/06 11:59
→ DrTech : ,光是google的排序,廣告,地域,都是被控制的。 11/06 11:59
→ DrTech : 想解決LLM有政治偏見,然後不解決更常用的搜尋引擎 11/06 11:59
→ DrTech : 或媒體有偏見。不是騙錢是什麼。 11/06 11:59
→ NexusPrime : 台灣的雜誌報紙不夠多嗎? 從古早以前國民黨剛來到 11/06 12:14
→ NexusPrime : 現在也累積很多了吧? 只怕是怕古早以前的都沒有數 11/06 12:14
→ NexusPrime : 位化或消失了 11/06 12:14
噓 snoopy920 : 天才 11/06 12:36
推 physicsdk : 93樓中肯,搜尋引擎超好控制的,媒體輿論都超容易 11/06 12:54
→ physicsdk : 被這種演算法把持得死死的 11/06 12:54
→ physicsdk : 它不用灌輸立場,只要選擇性地讓特定立場的資訊更 11/06 12:55
→ physicsdk : 容易浮上檯面就行了 11/06 12:55
→ Merkle : 繁中使用人數就是比簡中少 11/06 12:56
噓 D600dust : 還在火星文 這人是昭和年代的老害嗎 11/06 13:04
推 bizer : 國力強人多是優勢阿,同理哪個ai不管英文只有繁中 11/06 13:22
噓 trh123h : 不能用那為啥不用ChatGPT 11/06 13:31
→ iwanowsky : 那就先做個模型把簡中翻譯成繁中不行? 11/06 14:22
推 EPIRB406 : 軟硬體知識很多也都是簡體的,台灣沒什麼在分享 11/06 15:55
→ yudofu : 搜尋人為調整跟訓練資料導致不同推論的能比?要講人 11/06 16:51
→ yudofu : 為干預的話什麼都可以用陰謀論結案那還有甚麼好討論 11/06 16:53
→ yudofu : 的?一群天才.... 11/06 16:53
推 kkmoon5566 : 理由伯 11/06 18:29
推 WWIII : 網軍24小時輪班也很難贏 11/06 19:21
→ laechan : 台灣一堆別人翻好的不用自己生成 11/06 19:44
推 physicsdk : 嗯嗯,所以繁中資料量不足,要怎麼解決? 簡中要參 11/06 20:23
→ physicsdk : 考嗎? 還是中共國的我們都不該用,你陰謀論?XD 11/06 20:23
推 Alphaz : 好高騖遠 自不量力 11/06 21:35
→ odahawk : 不會改作台語AI嗎 11/07 08:50
推 tomer : 直到2000年代初期繁中資料量都還是贏的w 11/07 09:28
→ yunf : 亞洲四小龍概念? 11/07 10:02
→ yunf : 不要緣木求魚好嗎? 11/07 10:03
→ yunf : 重點是應該發展適合台灣的技術吧 11/07 10:06
→ yunf : 要引入別人的資料會不會有智財相關問題? 11/07 10:06
→ yunf : 這種東西早該知道的到底是誰在搞? 11/07 10:07
→ yunf : 有種問題叫作明知故問! 11/07 10:08
→ yunf : 30歲以下基本被洗腦的差不多了 11/07 10:09
→ PTTOnline : 全世界華語國家及地區只有塔綠斑島還在用繁體 11/07 10:14
→ PTTOnline : 連香港現在都越來越多人用簡體字,台灣還要鎖島多久 11/07 10:15
→ yunf : 就是沒有中心思想的才會慢慢被赤化 11/07 10:16
→ yunf : 因為你根本就不知道學正體中文的意義在哪 11/07 10:18
→ yunf : 你知道英國皇室菜單上用的是法文嗎? 11/07 10:20
→ yunf : 歐洲學界都要學拉丁文這件事知多少? 11/07 10:20
→ yunf : 繁中都學不完了更何況小篆 11/07 10:21
→ yunf : 隨便講幾條就夠你查到昏頭 11/07 10:23
→ yunf : 早說了他們花數百億美金建構的東西根本不堪一擊 11/07 10:30
→ yunf : 教你用殘體只是方便管理而已你以為是什麼? 11/07 10:36
→ yunf : 你懂法文嗎? 你懂拉丁文嗎? 11/07 10:37
→ yunf : 雖然不該在工人版講這個但千萬別以為你看到的 11/07 10:38
→ yunf : 就是趨勢 11/07 10:38
→ yunf : 很多道理不是每個人都需要懂的 11/07 10:39
→ yunf : 不要再積非成是了 11/07 10:39
→ yunf : 現在即便念到碩士也只代表那個學位的專業而已,不代 11/07 10:55
→ yunf : 表他文化水平!這就是西化的結果分工越來越細當你的 11/07 10:55
→ yunf : 工作是個輪子就永遠看不到方向盤在幹嘛只能照著命令 11/07 10:55
→ yunf : 做! 11/07 10:55
→ dbai20 : 我說就是正體字和殘體字,正體字是寶藏,我們要珍惜 11/07 13:34
→ dbai20 : 沒有什麼繁體簡體,就是正體和殘體啦 11/07 13:35
推 yudofu : 是不是跟能不能是兩回事,就算同樣繁體資料,如果 11/07 18:34
→ yudofu : 同樣繁體用戶加起來,可能香港也會覺得台灣資料太多 11/07 18:35
→ yudofu : 、簡中資料庫馬來華人也不一定同意訓練出來的結果 11/07 18:35
→ yudofu : 至於把簡體字當進步的可能是他們的腦容量有差到這幾 11/07 18:37
→ yudofu : KB吧,對這些腦容量有限的也不適宜講太多爆他們腦。 11/07 18:38
→ yudofu : 否則整天抄襲拼音文字科技的應該趕快完成他們未完成 11/07 18:39
→ yudofu : 的中文拉丁化夢想吧。 11/07 18:40
噓 wesson : 連基本翻譯都不會了還要訓練其他參數? 11/07 21:33
推 ipojay : 人口基數就在那邊 11/07 22:14