20240530 每日AI必读资讯
📂OpenAI宣布所有 ChatGPT Free 用户免费使用!!
- GPT3.5用户现在都可以免费使用网络浏览、视觉、数据分析、文件上传和 创建GPTs功能
📰美国AI禁令再升级:在美从事AI职业中国人或需要特殊许可
- 美国众议院通过「加强海外关键出口限制的国家框架法案」(ENFORCE法案)
- 该法案建议将人工智能、人工智能系统和涉及的人工智能系统的定义,纳入2018年《出口管制改革法》。
能力包括:
- 使专家或非专家能够设计、合成或获取危险的化学、生物、放射性或大规模杀伤性武器;
- 进行进攻性网络操作;
- 通过欺骗或混淆手段规避人类控制;
- 展示出与上述能力技术上相似或等效的性能。
🌐ChatTTS:专门为对话场景设计的文本到语音TTS模型
- 该模型经过超过10万小时的训练,公开版本在 HuggingFace 上提供了一个4万小时预训练的模型。
- 专为对话任务优化,能够支持多种说话人语音,中英文混合等。
- 模型还能够预测和控制细粒度的韵律特征,如笑声、停顿和插话等,还能进行更细粒度的调整,如语速、音调和情感等。
🔗 GitHub:https://github.com/2noise/ChatTTS
🛠️Khoj:一个开源的个人化AI 助手
- 能连接在线和本地文档,充当第二大脑。
- 可以连接本地的PDF等文件和在线Markdown、GitHub和Notion文件,并将它们与在线信息整合在一起。
- 在文档和笔记中提供快速、准确的语义搜索,帮助你快速找到所需信息。
- 还可以集成搭配 Obsidian 笔记工具
- 支持语音输入、图像生成、AI代理、联网搜索、支持网页、客户端,集成到聊天软件等各种访问方式。
🔗 https://blink.csdn.net/details/1711857
🤖Llama3-V:只用500美元的成本构建的基于 Llama3 的多模态模型
在几乎所有指标上,Llama 3-V 的性能与GPT-4V、Gemini Ultra和Claude Opus等规模大100倍的闭源模型相当。
唯一的例外是MMM U(多模态记忆任务),Llama 3-V略逊一筹。
Llama3-V 的架构结合了视觉模型和语言模型,由 Llama3 8B 和 siglip-so400m 驱动。
整个训练成本不到500美元。
🔗 HF Model:https://huggingface.co/mustafaaljadery/llama3v…
🔗 Github Repo:GitHub - mustafaaljadery/llama3v: A SOTA vision model built on top of llama3 8B.
🔍网信办等三部门:加快推进大模型、生成式人工智能标准研制
- 中央网信办、市场监管总局、工业和信息化部联合印发的《信息化标准建设行动计划(2024—2027年)》
- 信息化标准建设行动计划:加强国家信息化标准体系,推动网络强国建设。
- 推进重点领域标准研制:包括人工智能、区块链、云计算等领域的标准研制。
- 提升信息化标准基础能力:优化标准供给结构,加强标准化人才培养,推动标准数字化发展。
🎯OpenAI正训练GPT-4的继任者,GPT-5或将带来三个重大升级
- 更高准确性: GPT-5将通过更多数据训练提高回答准确性。
- 增加多模态: GPT-5有望支持视频输出,处理更多种类输入输出。
- 实现自主行动能力(AGI): GPT-5有望具备人工通用智能,能理解用户意图并自主完成任务。
🚀又炸!GPT-4o可自动生成Figma设计稿
- 自动化设计生成:根据PRD自动生成Figma设计稿,支持高质量设计系统。
- 理解PRD需求:能解析产品需求文档,填充样式、图标库和文本内容。
- 全球关注与期待:引起设计行业关注,被认为将改变设计行业格局。
🔗 https://blink.csdn.net/details/1711861