取消
清空记录
历史记录
清空记录
历史记录
web-ai是一个开源的TypeScript库,使开发的人能直接在浏览器或Node.js中运行现代深度学习模型。它提供了一种无需复杂服务器端基础设施或依赖第三方API的方式,将AI能力集成到Web应用程序中。
web-ai的关键目标是使设备上的AI对任何JavaScript开发者来说都是可访问的。它在后台使用ONNX Runtime进行高性能的神经网络模型推理,并处理缓存和基于Web Worker的并行化,以确保流畅的用户体验。
凭借其简单的API、强大的功能集和MIT许可证,web-ai旨在成为部署深度学习到Web的流行库。它让开发的人能在不受基础设施问题困扰的情况下进行AI实验。
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,稳定性很高,让您的云端之旅更加畅享。快来腾讯云选购吧!
字节跳动AI研究团队最近推出了一项名为StemGen的音乐生成项目,该项目采用了一种创新的深度学习方法,旨在让模型能够模仿现有音乐中的模式和结构,并以一种非常前卫的方式回应音乐背景。与常用的深度学习技术不同,StemGen采用了一种非自回归、基于Transformer的模型,强调对音乐背景的听取和响应不是依赖于抽象的条件。通过MeanOpinionScore测试确认了该模型生成逼真音乐结果的能力。
苹果公司与康奈尔大学的研究人员于10月份悄然推出了一款名为「Ferret」的开源多模态大型语言模型。这一研究成果首次在Github上发布,但并未引起太多关注,不进行任何宣布或庆祝。考虑到苹果与NvidiaGPU采用的历史,这被视为对GPU制造商的罕见认可。
StabilityAI是一家以StableDiffusion文本到图像生成器闻名的公司,宣布其新的基础图像到视频模型StableVideoDiffusion现已在其开发者平台上并通过其应用程序编程接口提供,允许第三方开发者将其整合到自己的应用程序、网站、软件和服务中。该公司写道:“这一新功能提供了对专为所有的领域设计的最先进视频模型的编程访问……我们发布此版本的目标是为研发人员提供一种有效的方法
亚马逊的研究人员在一篇论文中介绍了一种创新方法,旨在增强神经网络处理复杂表格数据时的性能。表格数据通常由行和列组成,看似简单,但当这些列在性质和统计特征上差异巨大时,就会变得复杂起来。这项研究为神经网络在处理复杂表格数据时的改进提供了新的思路和方法,有望在实际应用中取得更好的效果。
12月8日,著名开源生成式AI平台stability.ai在官网开源了,30亿参数的大语言模型StableLMZephyr3B。Zephyr3B专用于手机、笔记本等移动电子设备,主打参数小、性能强、算力消耗低的特点,可自动生成文本、总结摘要等,可与70亿、130亿参数的模型相媲美。其性能可与Falcon-4b-Instruct、WizardLM-13B-v1、Llama-2-70b-chat和Claude-V1等几个大参数模型相媲美。
生成式大语言模型因其在各种任务中的出色表现闻名,包括复杂的自然语言处理、创意写作、问答和代码生成。LLM已在易于使用的本地系统上运行,包括带有消费级GPU的家用PC,以改善数据隐私、可定制模型并降低推理成本。PowerInfer显着提高了LLM推理速度,表明其作为在GPU功能有限的台式电脑上执行高级语言模型的解决方案的潜力。
MetaAI最近开源了AVID,这是一项具有先进修复和扩展能力的T2V模型。AVID不仅支持通过文本编辑视频可以修复视频、更改视频对象、改变纹理和颜色,甚至删除视频内容或更换视频环境。在推理过程中,对于长度为$N^\prime$的视频,AVID模型会构建一系列片段,每个片段包含$N$个连续帧,并在每个去噪步骤中计算并汇总每个分段的结果。
在新的研究中,GoogleDeepMind的科学家们成功开发了一种名为GNoME的框架,通过这一框架,他们在材料科学领域取得了令人瞩目的成果。材料的发现对于技术进步至关重要,涵盖了从清洁能源到信息处理等各行各业的创新。跟随GNoME的足迹,继续在机器学习和科学发现方面取得共同进展,可能会带来深远的影响。
2023年5月,微软CEO纳德拉抛出一个惊人数字,未来全球的开发者数量将会达到10亿。那时候Meta的Llama已经开源4个月,但一些国内的开发者发现,从小以英文语料喂养起来的Llama,对中文世界并不友好。周靖人对通义千问的定位是“AI时代最开放的大模型”,现在打点好一切,静待开发者入场了。
深度求索发布了一个67B的大模型,名为DeepSeekLLM67B。这个模型完全开源,能够最终靠访问使用。在开放域推理的测试中,DeepSeekLLM67B展现出了较好的表现。
Songmeaning.AI 是一款基于AI的产品,旨在深入解读歌曲背后的意义。它利用自然语言处理和机器学习技术,为用户更好的提供有关歌曲的深层次解释和故事。Songmeaning.AI 帮助用户更好地理解和欣赏音乐,丰富他们的生活体验。
Penfriend 是一个基于成熟内容策略的文章生成工具,已为用户带来了 3010 万美元的收入。我们花费了 500 多个小时来完善提示,逐步指导您创建文章。无需信用卡。
Unstudio用AI为您的产品在营销、社会化媒体、网站等方面创造惊艳的视觉效果,无需摄影。训练于数百万图形,Unstudio将生成AI的力量置于各个品牌的手中。它提供拖放界面,样式定制,批量生成,A/B测试,节省设计时间和金钱等功能。
Room Reinvented是一个室内设计工具,提供Restyle Your Room、Virtual Staging、Sketch、AI-Generated Style Rooms等功能。用户都能够上传现有空间的照片,观看我们根据其喜好和需求来做魔幻变换。适用于需要焕新的业主、寻求个性化的租户,或者对他们的生活空间潜力感到好奇的人。此外,用户还可以上传空房间的照片,观看我们如何为其布置和装饰,使其对潜在买家或租户具有吸引力。Room Reinvented还提供手绘草图转换成逼真效果图的功能,以及由AI生成的风格房间功能,用户都能够探索不同的房间设计,无需上传照片。此外,用户还可以再一次进行选择30多种室内设计风格和20多种配色方案。Room Reinvented的订阅价格简单明了,首次渲染免费,每月29美元可生成300张图片。用户都能够随时取消订阅。
Tinkercad是一款免费、易于使用的三维设计、电子电路和编码应用程序。它提供基于项目的学习,帮助学生在课堂上树立对STEM的信心。Tinkercad适用于三维设计、电路和编码的学习和实践,能够适用于制作产品模型、可打印零件、电子电路和编码程序。
KahootGPT是一款强大的Chrome插件,利用OpenAI的自然语言处理功能,帮助Kahoot玩家提升游戏表现。它能生成每个问题的最佳答案,帮助玩家选择正确答案,还可以自动点击正确答案。无论是想提高成绩的学生还是喜欢玩Kahoot游戏的人,KahootGPT都能帮助你实现目标。
JetCounter是一款基于AI的物体计数应用,可以从照片中识别和计数物体。它能够在一定程度上帮助您自动化库存管理,减少错误计数,节约时机。JetCounter提供各种不同类别的内置模板,能够准确的通过您的需求识别和计数各种物体。您还可以上传自己的产品样本,定制模板以获得更准确的计数结果。JetCounter适用于各个行业,包括工业、医疗、食品等。请访问官方网站知道更多信息。
UI Auditor AI工具可以优化您的网站用户界面,通过自动化审核提高用户满意度。它提供功能强大的UI审核,帮助您优化设计并提升性能。了解更多关于UI Auditor的定价和功能,请访问官方网站。
Smart Tab by NoteGPT是一款集合书签管理、AI学习和知识库管理功能于一体的插件。它能够在一定程度上帮助用户轻松收集和管理标签,发现新的见解,并建立AI知识库。利用AI学习功能,它能够理解和分析用户保存的内容,并提供关键概念和想法,挖掘新的见解。适用于团队协作、学习和个人知识管理。
Adobe Photoshop的这一功能允许用户将普通照片转换成卡通风格。通过几个简单的步骤,用户都能够利用Photoshop中的工具和效果,如Poster Edges和Liquify,来创建独特的卡通和漫画效果。功能包括将照片转换成智能对象以进行非破坏性编辑,应用海报边缘效果,以及保存卡通化后的照片。
CodeArts Snap是华为云自研的基于盘古研发大模型的智能开发助手。它通过强大的软硬件算力底座、深厚的软件分析与安全可信基座、以及坚实的研发数据积淀,为开发者提供代码生成、知识问答、代码检查等多种智能化研发服务,大幅度提高软件研发效率,释放研发生产力。
InternVL通过将ViT模型扩展到60亿参数并与语言模型对齐,构建出目前最大的14B开源视觉基础模型,在视觉感知、跨模态检索、多模态对线项state-of-the-art性能。
TableX是一款能够从PDF或图片中提取表格数据的工具。用户可通过上传文件或拖放文件做相关操作,数据处理过程安全可靠。提取完成后,用户可下载提取的数据并以Excel格式保存。产品定位于提高数据提取效率和准确性的生产力工具。
ChatPuma是一款AI动力的无代码聊天机器人构建平台,可让您在几分钟内创建并部署到您的网站。它旨在利用您网站的有关数据,通过可嵌入的聊天气泡为您的客户提供实时准确的答案。
Colorcinch是一个免费的网页图像编辑工具,无需注册就可以使用。它提供了图片滤镜、贴图、文本、涂鸦等多种编辑功能,能轻松地个性化修改图片。用户都能够直接在浏览器中打开图片进行编辑,支持PNG、JPG等多种格式,还可以将图片转化为卡通效果。此外,Colorcinch还提供免费的图片托管服务。总体来说,这是一个简单易用、功能丰富的在线图像编辑工具。
PHO.TO是一个可以一键生成卡通头像的在线工具,它使用了世界上首个基于AI的照片转卡通技术,用户只要点击一个按钮,它就可以在专业卡通画家的质量水平上,将照片转换成卡通图像。该工具支持对单人、多人甚至全身照片进行卡通化处理,还可以与Photo Lab的其他效果组合使用,提供丰富的调整选项。用户不但可以获得卡通形象的个人头像,还能制作适用于各种场合的有趣卡通图像。
GPThelp是一款定制化网站聊天机器人,可以依据您网站的内容做训练,让您的客户根据您的网站、文件、普遍的问题等获取即时答案。用户都能够自行定制设计,改变AI的行为和监控对话。通过输入网站地址,GPThelp将自动获取网站上的所有页面,并在网站内容上训练您的AI聊天机器人。
RepBot.ai是一款全自动平台,可监控客户评论,生成定制回复并在Google和Facebook上发布,无需任何操作。它还提供AI支持的细致报告,帮助用户保护品牌声誉,提供卓越的客户服务。
DoodleMaker是一款利用AI技术自动将任何文本或内容转换成色彩丰富的涂鸦动画视频的工具。它集成了无限的文本转语音、语言翻译、完备的素材库等技术,可极大简化视频创作流程,无需技术经验即可轻松制作高质量的涂鸦视频。