网站地图官方微信:
网站首页 巍山镇 韦集镇 红船镇 王五镇 安居区 拉哇乡

当前位置: 首页 >

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。

这是第五题的原题,正确答案是A. - 1/2。

这是之前的第三方的测试结果,6个模型…。

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

  • | 有哪些事情是MacOS做不到但Linux可以做到的? |

    主持人 Paul 问:您认为新款苹果笔记本电脑如何? Lin...

    查看详情>>
  • | 为什么水泥封不住尸臭? |

  • | 在武汉,你们的找对象标准是怎样的? |

  • | 武汉连续多年进入中国旅游城市排行榜 TOP 10 行列,为什么本地人却总觉得武汉「没什么好玩的」? |

  • | 可以携号转网了,你会放弃移动吗? |

  • | 如何看待当今小学生的疯狂内卷? |

  • | 美国真会下场对伊朗开战吗? |

  • | 龙芯在.NET上帮微软做CPU指令集适配,为什么到国内.NET开发者这里成了维护龙芯.NET版本? |

  • | CPU 为什么很少会坏? |

  • | 老板说我设计了一周的海报还是不行,我到底该怎么学啊? |

  • | 如果战争爆发,中国普通老百姓枪都不会打该怎样自卫? |

  • 好多自媒体博主都是 用3D卡通数字人形象来代替***出镜,去...

    2025-06-19
  • 工作层面上,全是我一个人干。 1,有几个项目是直接用 ru...

    2025-06-19
  • 我是前飞蚊症患者,做了玻璃体切除术后飞蚊已经对我人生再也不产...

    2025-06-19
  • 因为穷,因为留守儿童很多。 所以留给发展成黄毛小太妹的基数...

    2025-06-19

关注我们

添加微信好友,关注最新动态