亚洲国产精品无码中文字,亚洲精品av中文字幕在线,亚洲成熟丰满熟妇高潮xxxxx

AI讀不懂時鐘，也算不出星期幾？基礎(chǔ)時間認知成挑戰(zhàn)

發(fā)布時間：2025-05-17 23:10 來源：ITBEAR 作者：任飛揚

近期，一項關(guān)于人工智能（AI）能力邊界的研究引起了廣泛關(guān)注。據(jù)LiveScience報道，盡管AI在編程、圖像生成、文本創(chuàng)作乃至部分標準化測試中表現(xiàn)出色，但在執(zhí)行日常生活中看似簡單的“讀時鐘”和“算日子”等任務時，卻頻頻失誤。

這項研究在2025年的“國際學習表征會議”（ICLR）上被詳細介紹，相關(guān)論文已在arXiv平臺上發(fā)布，盡管尚未完成同行評審。愛丁堡大學的研究員Rohit Saxena是論文的主要作者，他指出，人類對時間和日歷概念的掌握幾乎是本能的，而AI在這方面的欠缺應被視為一個需要重視的問題。

為了驗證這一點，研究團隊設(shè)計了一系列專門測試時鐘識別和日歷計算的圖像，并將它們輸入到多個具備圖文處理能力的大型語言模型中，包括meta的Llama 3.2-Vision、Anthropic的Claude-3.5 Sonnet、谷歌的Gemini 2.0和OpenAI的GPT-4。然而，測試結(jié)果顯示，這些模型在判斷時鐘時間和推算日期星期上的準確率均未超過50%。

Saxena進一步解釋，AI在處理時鐘問題時，不僅需要識別指針的位置，還要理解角度和分辨不同風格的表盤，如羅馬數(shù)字或藝術(shù)化設(shè)計，這遠比簡單的物體識別復雜得多。而日歷問題同樣困擾著AI，特別是在處理如“每年第153天是星期幾”這類問題時，錯誤率依然很高。

研究數(shù)據(jù)顯示，AI在讀時鐘上的正確率僅為38.7%，而在判斷日歷上的準確率更是低至26.3%。Saxena強調(diào)，AI的推理過程并不基于固定的算法規(guī)則，而是依賴于從訓練數(shù)據(jù)中學習到的模式，這導致它們的推理過程缺乏一致性和準確性。

研究還發(fā)現(xiàn)，當AI的訓練樣本中缺乏某些特定現(xiàn)象，如閏年或復雜的日歷規(guī)則時，它們的表現(xiàn)會進一步下降。即使模型已經(jīng)理解了“閏年”這一概念，它們也很難將這個知識正確地應用到具體的視覺判斷中。

針對這些問題，研究提出了兩個改進方向：一是增加訓練數(shù)據(jù)中的代表性示例，以確保AI能夠接觸到更多樣化的情境；二是重新審視AI如何整合邏輯推理與空間感知能力，特別是在處理不常遇到的任務時。這些發(fā)現(xiàn)不僅揭示了AI的當前局限，也為未來的研究和開發(fā)提供了重要的指導。

更多>同類內(nèi)容

亚洲精品国产a久久久久久,亚洲 激情 ,欧美精品,亚洲av日韩综合一区在线观看,亚洲精品不卡av在线播放,无码国产69精品久久久久同性

AI讀不懂時鐘，也算不出星期幾？基礎(chǔ)時間認知成挑戰(zhàn)

亚洲精品国产a久久久久久,亚洲激情 ,欧美精品,亚洲av日韩综合一区在线观看,亚洲精品不卡av在线播放,无码国产69精品久久久久同性

AI讀不懂時鐘，也算不出星期幾？基礎(chǔ)時間認知成挑戰(zhàn)