我是從以下兩個角度來看 * 數學上來說, "AI" 是否有「極限」? * 經濟上來說, "AI" 是否有「賺」? 例如說這隻影片 https://www.youtube.com/watch?v=5eqRuVp65eY 是從「熵」的
本質去探討 (目前架構下的) AI 是否有個 (來自其演算法、原始訓練資料的) 「 極限」?在模式識別 (pattern recognition) 這個方向的低垂水果是否已經摘完 了?新的方向會是什麼? 另一方面,從能源、物料、生產線、到營運設施, (目前架構下的) AI 是否有「 賺」?是否遵循以下式子? (賺得有沒有比其它項目多?) 價值 (value) > 價格 (price) > 成本 (cost) 另一個問題是上述式子中要素中 價值 (是否愈來愈好用?解決問題帶來的好處) 及 成本 (能源供給、計算方法及硬體的進步) 的演變趨式。 === 我自己對以上兩個題目的程度只有「讀別人整理好的二手資料,而且連用 AI 幫忙 都讀不太懂」,所以我的結論是 VOO無腦多 orz -- ※ 發信站: 批踢踢實業坊(pttweb.org.tw), 來自: 136.61.16.51 (美國) ※ 文章網址: https://pttweb.org.tw/Soft_Job/M.1730417529.A.AB1 對每天要寫程式的鄉民來說,或許可以參考一下這類資料/關鍵字,像是 https://arxiv.org/abs/2304.10778 (2023十月的資料) > Evaluating the Code Quality of AI-Assisted Code Generation Tools: An > Empirical Study on GitHub Copilot, Amazon CodeWhisperer, and ChatGPT >   > Results: Our analysis reveals that the latest versions of ChatGPT, GitHub > Copilot, and Amazon CodeWhisperer generate correct code 65.2%, 46.3%, and > 31.1% of the time, respectively. In comparison, the newer versions of > GitHub CoPilot and Amazon CodeWhisperer showed improvement rates of 18% > for GitHub Copilot and 7% for Amazon CodeWhisperer. The average technical > debt, considering code smells, was found to be 8.9 minutes for ChatGPT, > 9.1 minutes for GitHub Copilot, and 5.6 minutes for Amazon CodeWhisperer. > 評估AI輔助代碼生成工具的代碼質量:GitHub Copilot、Amazon CodeWhisperer和 > ChatGPT的實證研究 >   > 結果:我們的分析顯示,最新版本的ChatGPT、GitHub Copilot和Amazon > CodeWhisperer 分別生成正確代碼的比例為65.2%、46.3%和31.1%。相比之下,GitHub > Copilot和Amazon CodeWhisperer的新版本顯示出改進率分別為18%和7%。考慮代碼 > 品質的平均技術債務為ChatGPT 8.9分鐘,GitHub Copilot 9.1分鐘,Amazon > CodeWhisperer 5.6分鐘。 ※ 編輯: AmosYang (136.61.16.51 美國), 11/01/2024 07:36:42 今天也正好看到 HN 上的熱門討論 Google CEO says more than a quarter of the company's new code is created by AI Google CEO 說該公司多於四分之一的新程式碼是由 AI 創造 https://news.ycombinator.com/item?id=41991291 這討論串中有 Google 員工談它們的使用體驗,以及那 AI 工具團隊的 lead 也有 參與討論,可以看看: * https://news.ycombinator.com/item?id=42002212 * https://news.ycombinator.com/item?id=41992028 ※ 編輯: AmosYang (136.61.16.51 美國), 11/01/2024 07:42:13
neo5277: 總是會有賣油翁的,可能他們都追求神乎其技吧 11/01 10:41
可以理解
hiigara: 信 VOO 得永生,信 QQQ 得 AI 此生 11/01 12:49
pent: TSMC 無腦多 11/01 13:41
多拉A夢多 XD
pent: 認真問,哪個Ai寫的完整,千行以上程式都沒問題 11/01 13:43
印象中沒怎麼看過「有系統地針對 large codebase 來評量 AI 助手的表現」的資料。 網路上能找到的大多是個人體驗的分享,例如 * https://www.loom.com/share/ae710891c9044069a9017ee98ce657c5
neo5277: 總是會有賣油翁的,可能他們都追求神乎其技吧 11/01 10:41
hiigara: 信 VOO 得永生,信 QQQ 得 AI 此生 11/01 12:49
pent: TSMC 無腦多 11/01 13:41
pent: 認真問,哪個Ai寫的完整,千行以上程式都沒問題 11/01 13:43