Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

高静宜撰文微胖编辑

告别「锤子」时代,老罗拿万元显示器「重新定义」了什么?

「 37000 人,5 月 15 号,2 款产品,1 次革命。」这是罗永浩在微博上的留言。


由于发布的新品的颠覆性,罗永浩还给出贴心 Tips: 大家还需要准备好纸尿裤。

5 月 15 日傍晚,许多锤粉和媒体老师冒雨奔赴鸟巢,怀着些许期待和一点将信将疑、没有多喝水地入场就座,等候罗永浩走上舞台。

在现场观众发出的阵阵欢呼声中,罗永浩拿出的第一款产品,是锤子科技的年度旗舰手机坚果 R1。

「好看」,是发布会现场罗永浩用来形容这款手机频率最高的一个词。在工业设计方面,坚果 R1 拥有碳黑色(细红线版)、纯白色两种不同配色版本,采用 6.17 英寸18.7:9 广色域全面屏,1500:1 对比度,支持压力感应,屏占比达 84%。

在功能上,坚果 R1 延续了坚果 3 上配备的 AI 智能通话降噪技术。

这项技术基于深度学习网络,通过 4 亿个中文语音样本、2 亿个外文语音样本训练,可以像人脑一样分辩出人声和背景噪音并将噪音消除。用最直观的体验就是在嘈杂环境下通话,对方几乎听不到任何环境噪音。(我们找到大象声科,好好聊了聊坚果 3的AI 通话智能降噪

在时下手机厂商聚焦的 AI 摄影方面,锤子也跟上了脚步。

坚果 R1 支后置 1200 万+ 2000 万双摄像头,前置 2400 万摄像头。在虹软算法的加持下,坚果 R1 可以实现背景虚化、暗光及 AI 美颜等效果,应对光线较差的自拍环境,还支持指纹+人脸识别解锁方式。

配置方面,坚果 R1 搭载骁龙 845 顶级处理器、6GB 超大内存起,最高支持 8GB 运存,最高 1TB 存储空间,搭载 3600 mAh 超大电池,同时支持 18W 快充 +10W 无线充。支持双 4G 双 VoLTE,两张 SIM 卡可以同时 4G 待机。

然而,当现场出现这幅画面时,我们才知道坚果R1 不过是来热身的。

这款产品名为坚果 TNT 工作站(显示器),是基于 Smartisan OS 大屏版的桌面计算中心,才是锤子科技重新定义个人电脑下一个十年的载体。

坚果 TNT 工作站(显示器)。当然,TNT 并非三硝基甲苯炸药的简写,而是 Touch and Talk 的缩写。

「全局手势+语音组合输入」,一种试图从底层「重新定义」交互方式的创新。相较于传统的人机交互方式,即在语音输入指令时,要求用户提供大量重复信息,TNT 将手势和语音结合起来同步,增高了用户操作的成功率,提升了用户体验,比单一的图形交互、语音交互效率有显著改善。

坚果 TNT 工作站(显示器)配备 27 英寸 4K 超高清显示屏,支持电容式多点触控(十点)及多种操作手势,它还支持 2.1 声道立体声及双数字麦克风,还具有前置500 万像素摄像头,采用 Face++ 人脸解锁算法,具有 9 个数据传输接口和十个快捷虚拟按键。语音、语义技术仍然来自来与锤子合作较久的技术提供商,比如讯飞和三角兽。

使用坚果 TNT 工作站(显示器)进行操作时,仅在触控屏幕上点击倒水滴型按钮,就能够通过语音进行输入及发出语音指令。

在调用应用时,用户手指在按下屏幕低端 DOC 栏的同时,说出应用名字而非复杂的句型,就可以呼出相关应用。

用户指向某一窗口,并说「关闭其他(close others)」,除了该窗口外的其他窗口都将关闭,仅保留当前所指窗口。

不过在老罗展示 TNT 的交互能力时,TNT 也会「掉链子」——系统无法执行下达的语音指令。还好机智的老罗似乎对此早有预期,事先已经嘱咐现场观众在演出出现问题时高呼「理解万岁」。

当然,要打造一款「大屏效率神器」的锤子科技,所需做的远不止于交互方式的改善。

首先,坚果 TNT 工作站(显示器)还设计了水晶球智能功能( Crystal Ball ),可根据用户输入的内容及目前所进行的操作,预测得出其下一步最有可能进行的操作,并提供解决方案。

例如,Crystal Ball 可以根据照片预先提供美图效果、对即将 PS 的图片提前完成扣图、还能根据已有表格内容预测即将输入的内容。

与此同时,工作站拥有基于 Smartisan OS 大屏版的 Smartisan office 三件套,通过TNT 交互和 AI 智能算法,在 Word、PPT、Excel 办公中遇到的许多繁琐操作可以在瞬间完成。

在 PPT 的编辑与制作上,全新 PPT 软件提供 AI 边栏智能推荐排版。用户放入图片、文字素材后,AI 边栏即刻推荐基于素材的各种排版组合,点击即可采用选中的方案,提高了 PPT 排版效率也增加了 PPT 美观性。

毫无疑问,这种配图预测功能可以高效地解决 PPT 找图难题。用户只要在 PPT 编辑模式中点击预设的找图按钮,系统就可以根据 PPT 中文字内容自动智能分析文字关键词,提供匹配的海量正版高清图片资源。

在使用 Excel 进行数据统计时,用户则可以语音输入数字,选中数字并且口述「求和」指令,即可以对一列数字进行求和,及时得出结果。

其次,罗永浩还特别介绍了另一个名为发牌手( Poker Dealer )的解决方案,可以让用户在搜寻信息时同一屏打开多个窗口,显示不同搜索引擎搜索出来的信息。
坚果 TNT 工作站(显示器)支持全局聚合型搜索,一次输入就可以显示多个平台查询结果,包含本地搜索(来自文件、应用程序等)、网络搜索引擎、App 搜索结果,无需多网站及多 App 切换。

例如,输入某小说或歌曲名称,除了显示百度搜索结果外,屏幕上还会显示网易音乐、QQ 音乐、天猫等各网站、App 搜索结果,用户也可以自定义搜索引擎、App 类型及数量配比。

在罗永浩看来,TNT、Crystal Ball、Poker Dealerz 这三个系统性交互解决方案将会指导未来十几年甚至几十年。

显然,老罗非常有信心(似乎一贯如此)。

除此之外,坚果 TNT 工作站(显示器)基本全覆盖了锤子科技在愚人节视频中提及的十大前沿科技。例如,子弹短信( Bullet Messager )就解决了群聊人数较多时的信息显示与回复问题。用户可以一次性处理 10+ 联系人消息,当同时沟通的人数较多时,可以一次性在 27 英寸的大屏上显示超过 10 个对话窗口。需要对话时,点击相应的聊天窗口直接说话,即可发送信息给对方。

要搞清楚这次锤子新品究竟重新定义了「重新定义」,还是重新定义了人机交互,首先,你得有台 TNT。

摸肾时间到:坚果 TNT 工作站(显示器)售价 9999 元,如果买套餐,手机和坚果TNT工作站(显示器)组合预售共 14999 元。

不过,一切要等到三个月后了。

产业罗永浩锤子科技
1
相关数据
大象声科机构

大象声科(深圳)科技有限公司,简称Elevoc,于2017年在深圳成立,是全球领先的机器听觉人工智能公司之一,致力于提供尖端的智能语音增强和语音交互解决方案,打造更自然的人机交互体验。 大象声科云集了一批来自世界顶尖机器听觉科学家和经验丰富的产品研发团队,基于多年对计算听觉场景分析理论(CASA)的研究,应用前沿的深度学习技术(DL),为智能手机、VoIP云通讯、可穿戴设备、智能车载、智能家居等行业,提供全球领先的智能语音增强和智能语音交互解决方案。 大象声科已经与Qualcomm,Intel,arm,CEVA,Cirrus Logic,Infineon,Rockchip和BES等国内外知名芯片厂商建立了良好的合作关系,成功服务于小米、OPPO、vivo、一加、中兴、努比亚、黑鲨、魅族、海能达、美图、猎豹移动、51Talk等客户。未来,大象声科将与合作伙伴们一道,推动产品智能升级,让人工智能更贴近生活,服务人民,造福人类。

http://www.elevoc.com
相关技术
网易机构

网易成立于1997年6月24日,是中国领先的互联网技术公司,为用户提供免费邮箱、游戏、搜索引擎服务,开设新闻、娱乐、体育等30多个内容频道,及博客、视频、论坛等互动交流,网聚人的力量。

https://www.163.com/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

噪音技术

噪音是一个随机误差或观测变量的方差。在拟合数据的过程中,我们常见的公式$y=f(x)+\epsilon$中$\epsilon$即为噪音。 数据通常包含噪音,错误,例外或不确定性,或者不完整。 错误和噪音可能会混淆数据挖掘过程,从而导致错误模式的衍生。去除噪音是数据挖掘(data mining)或知识发现(Knowledge Discovery in Database,KDD)的一个重要步骤。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

推荐文章
从小米和锤子可以看出中国智能机厂商的水平