久久精品免费看国产成人,四虎国产精品亚洲一区久久,伊人精品久久久7777,成人欧美一区二区三区在线,99精品国产福利一区二区,亚洲精品成人毛片久久久,久久精品99精品免费观看 ,99热久久这里只有精品免费,久久精品免费一区二区三区

訊飛星火成“多學科最強考生”,在“AI高考中”多學科綜合能力領先
來源:今日熱點網 發布時間:2024-06-13 14:09:41

 

 

隨著2024屆高考落幕,近日,各家大模型的高考評測結果陸續出爐,多家媒體和專業人士用高考中英文作文題和數學題對大模型能力進行測評,訊飛星火不僅占據榜首,并超過GPT-4o,在本屆的“大模型高考”中,訊飛星火多學科綜合能力領先。

作為去年高考大模型數學能力測評的“扛把子”,在本屆的高考數學能力評測中,訊飛星火依舊能打,實力捍衛“最強理科生”地位。數學考試結束后,在搜狐科技針對國內十余家大模型的高考數學能力評測中,訊飛星火、文心一言、豆包均以63%的正確率位列第一梯隊,智譜清言、阿里通義則以50%的正確率位居第二梯隊,其他大模型相對落后。

在另一家教育類科技媒體的評測中,訊飛星火的數學能力依舊能打。一家教育類科技媒體“多鯨”選取北京數學卷——新高考一卷的倒數第二題(導數題),向海內外4個大模型進行了提問:ChatGPT-4o、Google Gemini-1.5、學而思九章大模型(MathGPT)、訊飛星火、ChatGLM-4 (智譜清言),提問包括原始題目和對結果的打分。在最終的評測結果來看,訊飛星火不僅給出了詳細的解題步驟,對比其他家大模型,還給出了更詳細的考點和對應知識點分析,在這一點上,訊飛星火是更貼合考生的“備考搭子”,考生可以將訊飛星火作為平時復習的AI輔助工具。實際上,科大訊飛早已將星火大模型的這項能力應用在了AI學習機的精準學功能中:搭載訊飛星火V3.5的學習機,可以通過幾道題精準找到孩子學習薄弱點,給出專屬學習路徑幫助孩子掌握相應知識點。

作為高考開考的第一科,各地高考作文題目每年都是全民熱議話題。在《科普中國》的一篇評測文章中,選取三家國內最常用的“AI”各寫了一篇作文,并委托一位高中語文教師做了點評。最終,AI考生訊飛星火“小飛”同學拿下46分的得分,遠超另外兩位“AI考生”。

評測的末尾,科普中國還點名表揚了“小飛同學”,認為小飛同學的文章里體現出了“人類學生自己未曾想到的角度”。

看來,訊飛星火的作文能力廣受外部認可,達到遠超高考語文平均分水平。筆者以今年的新課標II卷作文為例:“長久以來,人們只能看到月球固定朝向地球的一面,“嫦娥四號”探月任務揭開了月背的神秘面紗;隨著“天問一號”飛離地球,航天人的目光又投向遙遠的深空……正如人類的太空之旅,我們每個人也都在不斷抵達未知之境。這引發了你怎樣的聯想與思考?請寫一篇文章。”實測訊飛星火,交出的考卷如下:

河南省基礎教育教學專家庫成員、河南省學術技術帶頭人李來明根據高考作文評分標準針對訊飛星火的表現進行了點評:“這篇文章從引入話題,到分層論述,層次分明,論證清晰,符合議論文的寫作規范。文章不僅運用了材料素材,還能靈活運用事實論據,表達主旨。文章的語言表達用詞較為貼切,句式靈活,文句具有表現力。”最終,李來明給出了50分的評分,大模型考生在高考作文中達到一類文水平。

在英語能力測評中,訊飛星火也展現出了多語種方面的實力。今年的北京卷英語作文題目為題目為:“假設你是紅星中學高三學生李華。你的外國好友Jim準備給其校報的 Asia Today 欄目投稿。得知今年新中國成立 75周年,他打算重點介紹中國的發展成就,發來郵件詢問你的建議。請你用英文給他回復。”有考生走出考場后表示,感覺作文題目有點出乎意料,較平時準備的上了難度,筆者實測訊飛星火交出的考卷如何:

第一眼看上去,這篇英語作文行文流暢,語法準確,結構清晰,應該算是一篇標準的高考英語范文了。

同樣放到高考閱卷評分標準里,訊飛星火能拿幾分?

資深外語教研專家周國榮點評:

“這篇文章很好地回應了Jim的詢問,并介紹了中國幾個快速發展的領域。

內容上:作者提及了三方面,即高速鐵路、電信技術、可再生能源,涵蓋了中國近幾年高速發展的重要領域。

語言上:文章使用了較多高級表達,如highlight,demonstrate,significantly等,顯示了作者扎實的語言功底。

總體而言,這篇文章較好地完成了寫作任務,提供了具體的內容,也展現了作者對中國發展的關注和個人見解。”最終,周老師給出了18分(滿分20分)的得分,訊飛星火在高考英語作文中也奪得高分。

由此來看,在這波AI大模型高考“大練兵”中,訊飛星火憑借其優越的語言理解、文本生成、邏輯推理能力,在語文、英語、數學能力中綜合表現達國產大模型領先水平,是一位實打實的多學科綜合能力第一的“AI考生”。


標簽:

猜你喜歡