十年前,移动互联网充满朝气,每天都有新芽从智能手机的沃土中长出。

十年后,我们早已习惯了 Web 2.0 社会,相关技术也基本发展至中后期,我们中的极少数,正在寻找 Web 3.0 的曙光。

Open-AI/MetaVerse/NFT/Stable Diffusion/DeFi 云云,一众新词扎堆涌现,仿佛十年前的蓬勃光景再度重现。


(资料图片)

新的工具正摩拳擦掌,蓄势待发,没有人甘于落后。欢迎大家来到第七期 Hunt Good 周报,跨入数字工具次世代。

Happy Hunting!

Hunt Good 导读

Bento,将任务塞进「便当」

Readwise Reader,收集一切

Luma AI,iPhone 摄像头不光能拍照和扫码了

VALL-E,机器学舌

NeevaAI,ChatGPT 挑战者

Bento,将任务塞进「便当」

又双叒叕是一款 To-Do List 工具,这类型的软件大家早已见惯不怪了,为什么还有新人踏足这一品类,如果不能整出点新活,那一定会被时间冲刷掉,消失在我们视线之外。

Bento,这是「便当」的英文,这款 app 提议我们将日常工作先归类,再执行,而不是一上来就开干,在这套产品逻辑背后,其实开发者是想用这款 app,培养我们凡事「三思后行」的思维。

盲目开干不可取,先归类,每天事务如此地多,先分个轻重缓急,才不会像无头苍蝇那样到处碰壁。

它名字叫便当,交互上也像极了我们在给便当盒填充食物时的操作。

一般来说,便当盒有隔区,这放肉食,那放米饭,Bento 也是如此,他们借用了「便当理论」,在填写待办事项之前,就要求用户先把任务拆分成「小/中/大」三种类型,他们对这三种类型任务也有自己的定义。

小任务:容易解决,能帮你积累起工作自信;

中型任务:需要一定时间精力去处理,但难度不大;

重度任务:包括会议在内的,需要十分集中精神去处理的事项。

这一套归类思维,便是 Bento 的灵魂,值得我们学习借用,毕竟对于这么一款收费软件而言,不是所有人都愿意掏钱尝试,但每天当你往其他 To-Do 清单填写待办事项时,先想想执行次序,便也能达到 Bento 所能实现的效果。

Readwise Reader,收集一切

Readwise 是一款书摘软件,从它脱胎而来的 Readwies Reader,则是一款阅读器。

用它可以看 RSS、PDF、YouTube 视频,你可能会说,这不都是常规操作吗?但它把这些功能都做得更进一步。

可以在 RSS 网页标注并留下评论,信息采集爱好者必备功能;可以阅读 PDF 内容,同样可以进行批注;看 YouTube 内容时,可以将视频内容压缩成文字(自动输出逐字稿),然后划线收集加批注,大幅压缩视频内容的信息密度。不过该功能目前仅支持英文视频。

如果你将 Twitter 账号进行关联,就能保存 Twitter 的信息流内容,方便进行信息采集,电子邮件、电子书亦然(支持 Epub 格式)。

它的作用在于,尽可能将内容都采集到一个地方,方便查阅的同时,自己也可以从中找到毛线头,进行自己的思考作业。

同时它鼓励用户使用快捷键进行操作,一定程度上提升了桌面端采集信息的效率。

Luma AI,iPhone 摄像头不光能拍照和扫码了

苹果从 2017 年的 WWDC 起,便推出了 ARKit 增强现实开发套件,以供开发者针对 AR 场景开发应用,此举也被视为给未来的元宇宙硬件产品铺路。

而 2020 年,苹果在 iPad Pro 和 iPhone 12 Pro 上加入的 LiDAR 激光雷达镜头,则让移动设备也有了采集物体 3D 空间信息的能力。

经过两年的发展,手机也拥有可观的建模能力,于是 Luma AI 应运而生。

不得不说,Luma AI 的建模能力,初见细节已经非常细腻,配合现实世界的光影反射效果,网友惊呼:现在游戏的画质都那么高了吗?

在 Twitter 上,有网友利用 Luma AI 给摩托车手建模,放在游戏画面中,剪成伪赛车游戏视频,足够以假乱真。

还有作者将 Luma AI 的扫描图成像画面剪成 MV,颇有一番风味。

有意思的是,Luma AI 的创始人正是从苹果的增强现实及计算视觉部门出来的,知己知彼,因此 Luma AI 在 iPhone 上的效果也十分理想,乍看之下,它所完成的扫描精度,可以算得上是「照片级」了。

不过放大之后,还是会露馅,尤其是扫描毛绒玩具这类材质表面凹凸不平的物体,放大后会发现起表面变得模糊不清,一束束毛发变成了一坨不可名状物。

不过随着手机算力提升,得到更高清的模型只是时间问题罢了,在 Luma AI 的引领下,我觉得这个要求并不算难。

VALL-E,机器学舌

微软早前投资了 OpenAI,近期更是传出将跟投 100 亿美元,后续必然还会加大投入,因为微软已经打算将 OpenAI 所研发的人工智能技术融入到旗下产品的方方面面。

而微软在 AI 领域的最新成果是一项刚刚发表的论文,其中宣布了人工智能语音系统 VALL-E,它的最大特性是「鹦鹉学舌」。

VALL-E 可以对一段人类录音进行学习,录音时长只需超过三秒,它就能模拟出这个人的声线,输出其他语音内容,就连口音都能复刻。

目前这项技术尚未生成产品,只在 Github 上阐述了模型概要以及一些语音示例。

VALL-E 尚未完善,在一些示例中,它的模仿力很是强悍,与原声近乎相同;但在另一些示例中,人类原声带有明显的口音,而它生成的语音却字正腔圆,发音十分标准,容易露馅。

VALL-E 越接近真人,我心里越是担心,如果它落在坏人手上,是否会成为诈骗利益链条中的一环呢?

如果人类未来分辨不出电话那头的是真人或是 AI,那我们是否能够借助技术,帮我们进行甄别呢?

对此,VALL-E 也给出了自己的解决方案:增加了道德声明,后续用协议去规范使用用途,虽说聊胜于无,但有了一定约束,也能让一些「有贼心没贼胆」的人,回头是岸。

此外,微软除 VALL-E,还将把 ChatGPT 引入到 Bing 浏览器,将 OpenAI 的一些技术与 Office 套件融合,可见 2023 年「AI + Everything」的趋势,将愈演愈烈。

NeevaAI,ChatGPT 挑战者

都说 ChatGPT 是下一代搜索引擎的雏形,而如今一个搜索引擎做出了另一个「ChatGPT」,那就是 Neeva。

两年前 Neeva 被评选为 2021 年度百大最佳发明之一,就因为它没有广告,一班从 Google 出来的年轻人,建立了这个没有广告的搜索引擎,采用订阅制模式,一直活得好好的。

清爽的搜索界面

他们号称搜索结果更纯净,也更准确。如今他们将这一优势延续到问答平台上,推出了 NeevaAI。用法跟 ChatGPT 类似,界面只有一个文本框,用户把问题输入进框,数秒后它就能生成一个答案。

与 ChatGPT 不同的是,NeevaAI 会把回答里出现的内容来源统统标注出来,有据可依,可追溯来源,它生成的答案更有说服力。

NeevaAI 号称每日抓取数以亿计的网页内容,实时更新,这点比 ChatGPT 要先进一点。也正是这一点,NeevaAI 应用场景也更广。

当然了 ChatGPT 一旦开放联网功能,两者孰高孰低,就不好说了。

点击「在看

是对我们最大的鼓励

推荐内容