AI能写航天类长文甚至论文了?实测橙篇和Kimi
文|卫网君
第一部分
引子
一、科技行业对AI写作的需求
经过多方实测,由于本行业的专业性强、知识门槛比较高,到目前为止,AI写作还是只能起到辅助性的作用。但是,这对科技行业,航天以及商业航天来说,已经是非常大的助力。
那么,能辅助科技行业写作的AI哪家强?
我们梳理了科技行业对AI写作的主要需求,大致有四类:
01
对知识和事实绝对准确
描述准确是第一位的要求。特别是在航天,无论人类作者还是AI,都需要对专业术语、技术和商业数据,具有准确的理解、分析和运用能力。因为知识基础的宽度比较小,机器学习的训练强度不足,一个AI写作工具是否能具备准确性,是首先需要考察的。
02
对论述的逻辑性足够严密
尤其是课题研究、研报、论文,主要基于自然科学,追求绝对理性而排斥感性,因此对写作成果的逻辑有着严密的要求。往往需要通过计算、推导的方式,来引出结论或者质疑。AI写作在人文科学领域的成功,是否能延续到科技行业,需要重点考察。
03
对文献的引用详细清晰
04
具备一定的时效性
二、测评标准
我们计划从5个维度,对本次两个AI工具分别进行考察和评分。
1.文件上传规模
国内外各种AI写作工具,都陆续开发了可自行上传文件功能,供AI读取分析参考。理论上说,专业文献的浏览基础越宽,对文字成品的正确性、严密性贡献越大。因此,文件上传数量将作为第一个考察对象。
上传数量
打分
不能上传
0
小于20份
20分
21~50份
40分
51~80份
60分
81~100份
80分
101~150份
90分
151份以上
100分
2.文件上传格式
上传格式
仅能接受PDF
能接受PDF和DOC
能接受PDF和DOC、JPG(或PNG)
3.专业资料
不能搜索
能搜索中文互联网资料
能搜索万方或知网
能搜索万方、知网和国外常规学术库
能搜索万方、知网和有关国内外机构官网
能搜索万方、知网和有关国内外机构官网,NASA、IAC和IEEE等数据库
4.长文生成能力
文字长度
不超过200字
0分
201~500字
501~800字
801~1000字
1001~4000字
4000字以上
可用性
无录用价值
需要人工改动超过60%
需要人工改动超过40%
需要人工改动超过20%
需要人工改动超过10%
需要人工改动超过5%
需要人工改动不超过5%
第二部分
实测
一、文件上传能力测评
对于文件上传能力和上传种类,根据使用说明,橙篇允许上传100个文件,Kimi允许上传50个文件。
把文件数加码到100篇(包含上面的50篇,总大小238M),用橙篇再次上传,全部成功。
考虑到网络环境等多种因素,操作体验并未列入本次打分项目中。按上一节的打分标准,橙篇得分80分,Kimi得分40分。此外,橙篇对单一超大文件的解析能力更强大,可作为加分项。
更详细测评过程,可在下方框内滑动观看
上传文件能力实测
*上传文件数量
橙篇,最多100个文件,每个200M。
Kimi,最多50个文件,每个100M。
*解析上传结果通知
橙篇,上传结束后,成功与失败结果,会明确通知;Kimi没有明显的通知,需要自己翻看上传文件。
*解析上传速度及结果
Kimi,用时34秒89,但提示“只能阅读全部文件的67%,请删减后发送”。最后删减到34个文件才得以发送。
橙篇,全部上传成功,但耗时相对较长,2分27秒。
把文件数加码到100篇(包含上面的50篇),用橙篇再次上传,全部成功。
*多个文件的解读:以总结核心要点为例
*影印版PDF文件
上传了一个《卫星与网络》2005年老杂志的PDF文件,当时都是用扫描实物杂志的方式,保留电子文件。
橙篇和Kimi都顺利解析上传。并对内容做了总结,Kimi一如既往地惜字如金风格。(下图1,橙篇;图2,Kimi)
*超大文字图片量的PDF文件
放个大招。找到之前买的一本电子书,上传上去,让两个AI试着读一读。PDF格式文件,内容为扫描图片,图文混合,内页223页,文件大小92.4M。
橙篇,第一次上传失败,第二次失败,有点吃力哈。
第三次上传成功!并且顺利总结出书籍的核心要点,还是有点厉害的!并且可以看出,并不是通过直接读取目录来走捷径。
*Excel表格文件
我们上传了一个包含3个子表格的excel文件(第一个子表格内容如下)。向两个AI同时提问:从第一个子表格中,能看出什么信息?
Kimi,信息抓取和解读基本完美;美中不足是,把第二个子表开头的备注文字,抓取为第一个子表格内容了。
下图为“6”提到的这段话,可分明位于第二个子表格的开头,Kimi非说它位于第一子表的底部。
橙篇,犯了同样的内容定位不够准确的小问题。总结的内容感觉有些散,不够精炼到位。
在上传文件类型上,两者都能识别PDF、DOC、EXCEL、TXT等常用文件,也都能接受JPG等图形文件上传。但对图文混排页面的识别能力有所不同,各有短长。得分均为100分。此外,相较于Kimi仅能读取包含文字信息的图片,橙篇基于文心大模型能力支持,可以识别分析纯画面图片文件,可算作加分项。
上传并解读图片实测
*带文字图片的解读
上传洞庭湖决堤卫星对比图,图上带有简单文字信息,PNG格式。向AI提问:能从图上看到什么信息?
图源:吉林一号
Kimi:能解析上传图片,回答如下:
可以看出,Kimi仅读取了图片上的文字信息,基本没有“读图”能力。
橙篇:能解析上传图片文件,除了读取文字,也能读取画面,回答如下:
橙篇回答的全文如下,结合图上文字信息对图片的分析基本正确。
2.地点与环境变化:
·地点一致性:两张图像展示了同一地点的不同状况,确保了对比的准确性。
·植被到洪水:左侧图像显示大片绿色植被,而右侧图像则显示该区域被洪水淹没,植被颜色转变为黄色和棕色。
3.气候变化影响:
·洪水迹象:右侧图像中的颜色变化(绿色转黄棕)是洪水发生的明显迹象,表明该地区遭受了自然灾害。
·气候异常:这种快速变化可能反映了极端天气事件或气候模式的异常,对当地生态系统造成严重影响。
4.自然灾害的直观展示:
·洪水覆盖:右侧图像中,原本植被茂盛的区域几乎完全被洪水覆盖,显示了洪水灾害的广泛性和严重性。
·生态环境影响:洪水不仅破坏了地表植被,还可能对土壤质量、水资源及生物多样性产生长期影响。
5.卫星图像的作用:
·监测能力:卫星图像能够实时监测地球表面的变化,为灾害预警、环境评估提供重要依据。
·科学研究价值:这些图像对于气候变化研究、生态系统监测以及灾害风险评估等领域具有重要价值。
6.图像标注与说明:
·图像说明:虽然未直接给出文字说明,但图像本身及其变化已足够说明问题,展示了卫星图像在监测环境变化方面的直观性和有效性。
*GIF动图
橙篇:无法上传;Kimi:图上有文字信息的,可以上传。
*JPG纯图,无文字
随便搜索下载了一张星舰发射照片,“喂”给AI,问它能看到什么信息。
橙篇基于模型能持,可以识别纯画图。但是,进一步问它“能否分辨出是什么火箭”,它说信息不够,不能。
Kimi,直接反馈说“未提取到文字”,因此不能上传。
*带图形化文字的图片
跟橙篇继续玩耍一下,上传了四张马斯克的照片,问它:能读取到什么信息。
橙篇很快回答:
从提供的几张图片中,如果假设图上的是同一个人,我们可以读取到以下信息:
1.着装风格:
·这位男士在不同场合均偏好穿着正式,如黑色西装外套、白色或灰色衬衫、黑色裤子以及黑色皮鞋,展现出其专业且严谨的形象。
2.发色与发型:
·他的头发是棕色的,有的图片中显示其头发略显蓬松或自然卷曲,这表明他可能有固定的发型打理习惯。
3.表情与姿态:
·在不同场景下,他的表情各异,但均显得自信且控制得当。例如,在火箭发射现场他表现出兴奋和庆祝的姿态,而在其他正式场合则显得专注或放松。
·他的肢体语言也富有表现力,如在庆祝时双手高举,在正式场合则交叉双臂或双手放在桌子上。
4.背景环境:
·其中,有背景明确显示了“SPACEX”字样,这是SpaceX公司的标志,进一步强化了他在该领域的身份或关联。
5.特定动作:
·在一张图片中,他做了一个OK的手势,这可能是对某项任务或决策的确认或满意表达。
6.职业身份:
·考虑到图片中的背景和着装,以及他在不同场合下展现出的自信和专业态度,可以合理推测他可能是航天领域的企业家或高管,尤其是与SpaceX公司有关联。
7.品牌或平台关联:
·其中一张图片右下角有“网易云音乐”字样,这可能表明该图片与网易云音乐平台有某种关联,尽管这并不直接反映该男士的个人身份或职业背景。
需要注意的是,以上信息均基于图片内容的直观解读和合理推测,并未涉及具体的个人身份确认或详细背景调查。
读图能力还是比较出色的,准确看到并识别出火箭上的“SPACEX”字样。
既然有文字,我们也试试Kimi。结果,它判断出了图片包含字符,所以允许我上传了图片,但最终没能把文字信息是什么,判断出来。
二、文献写作的三级出题与评分
1.简易题:
如何分析星链系统的市场前景
①专业资料
橙篇的长文生成功能,其参考文献数据检索由百度学术提供,搜索了8篇国内外专业文献,其中部分文献来自万方或知网,以及国外学术期刊,未能搜索和引用国内外机构官网资料及NASA、IAC和IEEE资料,得60分。
②长文生成
橙篇具备长文生成功能,我们用同样的题目测试了两次,一次生成了4109字的论文(仅正文,全文同),一次生成了近1.4万字的论文。得100分。
在橙篇的首页,有专门的长文生成入口,非常方便。
进入后,有明确的使用指引。
“参考范文写作”,可以上传参考文件。我们点击“输入主题生成”,输入标题,橙篇首先生成了论文大纲。还可以直接在大纲上进行编辑修改、调整顺序、分部分上传参考文献的操作。
对大纲整体不满意,可以选择重新生成,满意,则点击“生成长文”。橙篇告诉我,需要等待10分钟,如果无聊,可以同步新开窗口跟它聊天,还挺贴心。
点击进入在线编辑,目录清晰,结构完整,符合论文格式标准。
还可以选择任意段落、句子,进行智能编辑,进一步完善。
总体来说,橙篇的长文生成功能比较强大。当然,橙篇也提醒说,仅供个人使用,“请勿用作其他商业用途或用于学术不端行为”。
我们邀请了编辑部副主编,以相对宽松的标准,对两个AI的“作业”进行评判。
可滑动查看橙篇生成的短文
星链系统市场前景的分析(短综述)
分析星链系统的市场前景,可以从多个维度进行考量,包括技术实力、市场需求、竞争格局、政策环境等方面。以下是对星链系统市场前景的详细分析:
一、技术实力
1.卫星制造与发射能力
星链系统由SpaceX公司开发,该公司具备强大的卫星制造和发射能力。SpaceX的猎鹰9号火箭不仅发射成本低(有望优化至1700万美元/次),而且能够实现“一箭多星”的发射方式,大大提高了发射效率。此外,猎鹰9号火箭还具备可回收再利用的特性,进一步降低了发射成本。
星链卫星的制造成本也相对较低,每颗卫星的制造成本小于2000美元(编辑注:错误,应该为2000美元/kg),这有助于实现大规模的生产和部署。
2.通信能力
星链系统使用相控阵天线形成多波束,可以连接多终端,提供高速、低时延的通信服务。随着技术的不断升级,星链卫星的通信能力也在不断提升。例如,微版v2.0卫星的通信能力是v1.5卫星的4倍,且配备了星间激光通信模块,大幅提升了星座的星间通信能力。
星链系统已在全球多个地区实现落地应用,用户数量持续增长,证明了其技术实力和市场认可度。
二、市场需求
1.全球互联网接入需求
随着全球互联网用户数量的不断增加,对高速、稳定的互联网接入需求也在持续增长。星链系统作为全球最大的低轨卫星互联网星座,能够覆盖全球大部分地区,为偏远地区、海上航行、航空旅行等场景提供互联网接入服务。
2.应急通信需求
在自然灾害、战争等紧急情况下,传统的地面通信网络可能会受到影响甚至中断。星链系统作为天基通信网络,具备不受地面环境影响的特点,能够在紧急情况下提供稳定的通信服务,满足应急通信需求。
三、竞争格局
1.竞争态势
目前,全球低轨卫星互联网的星座主要有星链、亚马逊Kuiper、EutelsatOneWeb、TelesatLightspeed等。这些星座都在积极布局低轨通信市场,但星链系统凭借其规模优势、技术实力和市场认可度,在竞争中处于领先地位。
2.差异化竞争
星链系统通过不断升级技术和优化服务,提升用户体验和满意度。同时,星链系统还积极拓展新的应用场景和市场领域,如手机直连业务、海事通信、私人飞机通信等,以差异化竞争策略巩固市场地位。
四、政策环境
1.国际政策
各国政府对于低轨卫星互联网的发展持不同态度。一些国家鼓励和支持低轨卫星互联网的发展,认为其有助于提升国家通信能力和应急通信水平;而另一些国家则对低轨卫星互联网的发展持谨慎态度,担心其可能带来的安全和隐私问题。
2.监管政策
随着低轨卫星互联网市场的不断发展,各国政府也在加强对其的监管力度。监管政策的出台将规范市场秩序,促进市场的健康发展。同时,监管政策也将对星链系统等低轨卫星互联网星座的运营产生影响。
综上所述,星链系统凭借其强大的技术实力、广阔的市场需求、领先的竞争格局和积极的政策环境,具有广阔的发展前景。然而,随着市场竞争的加剧和监管政策的不断完善,星链系统也需要不断优化技术和服务,以适应市场变化和满足用户需求。
可滑动查看Kimi生成的短文
分析星链系统的市场前景可以从以下几个方面进行考虑:
1.市场规模与用户基础:
星链系统已经成为SpaceX公司最赚钱的业务之一。2023年,星链收入达到41.78亿美元,预计2024年将突破100亿美元。截至2023年底,星链已经在全球65个国家实现落地应用,服务用户超过200万。星链的用户规模有望从260万增长到10亿。
2.技术进步与升级:
SpaceX公司不断升级星链系统,推出了不同版本的卫星,包括v0.9、v1、v1.5和v2.0Mini。最新的v2.0卫星计划大幅提升通信能力,并实现与手机直连的功能。这种技术进步不仅提升了星链的服务能力,还为未来的市场扩展奠定了基础。
3.服务范围与市场拓展:
星链系统已经覆盖了美洲、欧洲、大洋洲、亚洲和非洲的部分地区。2023年,星链在亚洲和非洲的市场拓展尤为显著,例如在菲律宾、韩国、蒙古国、马来西亚、尼日利亚、卢旺达、莫桑比克等地推出了服务。这种全球覆盖的优势使得星链在解决偏远地区和基础设施不完善的国家的网络接入问题上具有重要作用。
4.多元化业务发展:
SpaceX公司不仅在传统的宽带互联网服务上发力,还在机载服务、船舶服务等方面进行了拓展。例如,星链系统已经为多家航空公司和邮轮公司提供服务,未来还计划推出手机卫星直连服务。这种多元化的业务布局有助于星链系统在不同市场领域中获取更多的市场份额。
5.军事应用与国防需求:
星链系统在军事领域的应用也不容忽视。SpaceX公司与美军合作,推出了“星盾”国防专用星座,并在俄乌冲突中展示了其通信和信息共享的能力。这种军事应用不仅提升了星链的市场价值,还为其在全球范围内的推广提供了支持。
6.市场竞争与挑战:
尽管星链系统在全球范围内具有显著的竞争优势,但也面临着来自其他国家和企业的激烈竞争。例如,中国、英国、日本(编辑注:日本尚没有提出自建低轨互联网星座)等国也推出了类似的卫星互联网计划,试图在这一市场中分一杯羹。这种竞争可能会对星链系统的市场份额和定价策略产生影响。
7.经济效益与盈利模式:
星链系统的盈利模式主要依赖于用户设备一次性费用和后期使用费用。目前,星链的收费标准包括家庭用户的标准版、企业用户的优先版、移动用户的移动版和海事用户的移动优先版。这种灵活的定价策略有助于吸引不同需求的用户,提升整体的经济效益。
综上所述,星链系统在技术进步、市场拓展、多元化业务发展和军事应用等方面都展现出强大的市场前景,但也面临着激烈的市场竞争和挑战。未来,星链系统需要不断创新和优化服务,以保持其在全球卫星互联网市场中的领先地位。
可左右滑动查看橙篇生成的长论文
2.中等难度题
对中国商业发射市场的风险评价和分析
Kimi只搜索11篇中文互联网资料,未能搜索和引用更多资料,得20分。
使用橙篇长文生成功能,生成了8234字的论文。得100分。
(篇幅原因,本题省略展示AI写作作品)
3.高难度题
Kimi搜索12篇中文互联网资料,未能搜索和引用更多资料,得20分。
使用橙篇的长文生成功能,生成了5437字的论文。得100分。
液氧煤油发动机与液氢液氧发动机重复利用的经济性对比(短综述)
一、燃料成本
液氧煤油发动机:
煤油作为燃料,其价格相对较低,这使得液氧煤油发动机的燃料成本具有显著优势。
液氢液氧发动机:
液氢作为燃料,其能量密度高,但价格也相对较高,是煤油价格的数倍乃至更多。
液氢的储存和运输条件极为苛刻,需要极低的温度(-253℃),这增加了储存和运输的复杂性和成本。
二、发动机设计复杂度与技术门槛
设计相对简单,技术门槛较低,这使得其研发、生产和维护成本相对较低。
液氧煤油发动机已经过多次试车和实际应用验证,技术成熟度较高。
设计复杂度高,技术门槛高,需要解决低温燃料储存、高效燃烧、隔热等多个技术难题。
研发、生产和维护成本相对较高,对人才、设备和材料的要求也更为苛刻。
三、重复利用的经济性
由于燃料成本低、设计简单且技术成熟度高,液氧煤油发动机在重复利用时具有较高的经济性。
例如,中国自主研制的130吨级可重复使用液氧煤油发动机已圆满完成多次起动地面点火试验,显示出良好的重复利用潜力。
尽管液氢液氧发动机在性能上具有显著优势(如高比冲、清洁无污染等),但其高昂的燃料成本和复杂的发动机设计使得其在重复利用时的经济性相对较低。
然而,随着技术的进步和成本的降低,液氢液氧发动机在特定领域(如深空探测、载人航天等)的重复利用仍具有广阔的前景。
四、综合对比
液氧煤油发动机液氢液氧发动机
燃料成本低高
设计复杂度相对较低非常高
技术门槛较低极高
重复利用经济性较高(基于燃料成本和设计简单性)相对较低(但具有潜在增长空间)
综上所述,液氧煤油发动机在重复利用的经济性方面优于液氢液氧发动机,这主要得益于其较低的燃料成本和相对简单的发动机设计。然而,随着技术的不断进步和成本的降低,液氢液氧发动机在特定领域的应用前景仍然广阔。
液氧煤油发动机和液氢液氧发动机重复利用的经济性对比(短综述)
液氧煤油发动机和液氢液氧发动机各有其优势和特点,在经济性方面也存在差异。
液氧煤油发动机的优势在于其较高的效费比,符合可靠性高、无毒环保、性能高、成本低、使用维护便捷的发展趋势。液氧煤油发动机使用煤油作为推进剂,燃烧产物为水蒸气和二氧化碳,无毒无污染,是一种综合性能优秀的推进剂。此外,液氧煤油发动机的研制带动了新材料的发展,如超低温铸造高强不锈钢、超低碳马氏体不锈钢等,推动了国家高性能特种材料的发展。
在经济性对比方面,液氧煤油发动机由于其较低的制造和运行成本,以及较高的可靠性,可能在商业航天运输系统中具有较好的经济性。而液氢液氧发动机虽然在比冲上具有优势,但其制造和运行成本相对较高,特别是在液氢的储存和运输方面需要较高的技术要求和成本投入。
综合考虑,液氧煤油发动机在经济性方面可能更具优势,尤其是在重复使用和维护成本方面。然而,液氢液氧发动机在执行特定任务,如深空探测时,由于其高比冲特性,可能更为合适。具体选择哪种发动机,需要根据实际任务需求、成本效益分析以及技术发展水平来综合评估。
第三部分
结论
根据分值累加,对橙篇和Kimi做出定量评价。橙篇总得分为865分;Kimi总得分为460分。
对比项
橙篇
KIMI
文件上传能力
80
40
文件上传种类
100
简易题专业资料引用
60
20
简易题长文能力
95
50
中等题专业资料引用
中等题长文能力
70
高难度题专业资料引用
高难度题长文能力
总分
865
460
根据分值,可以认为,橙篇更接近于科技行业的实际使用需求。在动态报道性和综述性文献写作方面,已经可以替代大部分人类工作,可以成为研究人员的有力工具。在专题报道、学术论文方面,还有较大差距。
对于具有一定深度的市场和技术融合选题,橙篇能够生成较为严密的论述结构,提出了模型分析的思路,但是未能实现具体分析。Kimi同样可以用来制作短评,但无法制作深度内容。
对于专业细分颗粒度较细、较为纯粹的工程科学选题,两个AI写作工具均未达到创作门槛,但橙篇可以用来协助研究人员搜索部分参考文献,具备一定价值。
因此,橙篇对科技行业的文献写作,包括行业媒体和专业研究人员,具备一定的价值。但仍然需要在专业化领域进行深度研发。Kimi目前在科技行业写作的价值较为有限。
>End
未按照规范转载及引用者,我们保留追究相应责任的权利
HISTORY/往期推荐
充满激情的新时代,
充满挑战的新疆域,
与踔厉奋发的引领者,
卓尔不群的企业家,
一起开拓,
一起体验,
一起感悟,
共同打造更真品质,
共同实现更高价值,
共同见证商业航天更大的跨越!
——《太空与网络》,观察,记录,传播,引领。
·《卫星与网络》编辑委员会
高级顾问:王国玉、刘程、童旭东、相振华、王志义、杨烈
·《卫星与网络》创始人:刘雨菲
·《卫星与网络》副社长:王俊峰
编辑:艳玲、哈玫,周泳、邱莉、黄榕、娜娜
主笔记者:李刚、魏兴、张雪松、霍剑、乐瑜、稻子、赵栋
策划部:杨艳、若、李真子
视觉总监:董泞
专业摄影:冯小京、宋伟
设计部:顾锰、潘希峎、杨小明
行政部:姜河、林紫
业务部:王锦熙、瑾怡
·卫星与网络各分部:
成都分部负责人:沈淮
长沙分部负责人:宾鸿浦
西安分部负责人:郭朝晖
青岛分部负责人:江伟
·卫星与网络总部负责人:农燕
·会议活动部负责人:乔颢益、许克新、董今福
·投融资及战略层面合作:刘雨菲
·本平台签约设计公司:一画开天(北京)文化创意设计有限公司