Skip to content

Latest commit

 

History

History
416 lines (327 loc) · 32.9 KB

README.md

File metadata and controls

416 lines (327 loc) · 32.9 KB

Awesome AI

收集分享 AI 大型语言模型 (LLM)、AI 辅助编程、AI 绘画等领域的常用资料,探索生成式人工智能的应用与开发。

目录

🔍 提醒:善用搜索,按 Ctrl+F 或 ⌘F 定位到你想找的关键词。
💡 持续更新中,建议添加到浏览器收藏夹,平常一定会用到。

Book

大型语言模型  

OpenAI GPT / o1 / ChatGPT  

Claude

  • 简介:Anthropic 公司发布的多模态 AI 模型。Claude 的模型规模从小到大分别有 Haiku、Sonnet、Opus 三个版本。
  • 官网:https://www.anthropic.com/claude
  • Web 产品(Claude):
    • 入口:https://claude.ai/ (需要验证海外手机号)
    • 定价:有免费版。专业版套餐 $20 / 月。
  • 相关资料:

Google Gemini  

百度文心大模型 / 文心一言  

智谱 GLM / ChatGLM(智谱清言)  

Moonshot AI / Kimi

更多

AI 编程  

GitHub Copilot  

  • 简介:AI 辅助编程领域的标杆。由 GitHub 和 OpenAI 共同开发,作为编辑器插件集成到开发环境中,支持 VS Code 和 JetBrains IDE 等主流开发工具。它提供代码补全、智能对话、多文件编辑等功能。
  • 官网:https://github.com/features/copilot
  • 定价:个人版:$10 / 月(第一个月免费试用;老师和学生可免费使用)

Cursor

  • 简介:AI 辅助编程领域的后起之秀。Cursor 是一款编辑器,基于 VS Code 内核。除了基础的代码补全功能以外,它还提供了批量补全、预测下一步操作、智能对话、多文件编辑等高级功能。
  • 官网:https://cursor.com/
  • 定价:https://cursor.com/pricing
    • 免费版(两周的专业版试用期 + 2000 次补全 + 有限次对话请求):免费
    • 专业版(无限次补全 + 每月 500 次快速对话请求 + 无限次慢速对话请求):$20 / 月

其他

  • AI 编辑器:
    • Windsurf:Codeium 出品的一款代码编辑器,基于 VS Code 内核,集成了 Agent 能力,支持各种高级的 AI 辅助编程功能。新用户可获得 2 周的专业版套餐试用期。
  • 编辑器插件:
    • Cline(原名 Claude Dev):VS Code 插件,融合了 Agent 思维,通过对话生成(或修改)项目代码。需自备 LLM API。已开源
    • CodeGeeX:智谱旗下的智能编程助手。支持 20 多种编程语言,适配 VS Code 和 JetBrains IDE 等主流开发工具。个人用户免费。企业用户可选择私有化部署服务。
    • MarsCode:字节跳动豆包大模型旗下的智能编程助手。提供智能补全、智能预测、智能问答等能力,适配 VS Code 和 JetBrains IDE 等主流开发工具。个人用户免费。
    • 通义灵码:编辑器插件,支持 VS Code 和 JetBrains IDE 等。个人用户免费。
    • Codeium:编辑器插件,支持 VS Code 和 JetBrains IDE 等。
      • 定价:个人版(代码建议 + 对话):免费
    • Tabnine:编辑器插件,支持 VS Code 和 JetBrains IDE 等。
      • 定价:基础版(基础的代码补全功能):免费
    • Amazon CodeWhisperer:编辑器插件,支持 VS Code 和 JetBrains IDE 等。
      • 定价:个人版(代码建议 + 参考跟踪 + 安全扫描):免费
  • 网页设计与生成工具:
    • Bolt.new:StackBlitz 出品的 AI 编程工具,可在线生成、编辑、运行、部署全栈网站,一站式解决网站开发需求。支持多种基于 JS 的前后端技术栈。
    • v0.dev:Vercel 出品的 AI 网页设计开发工具。通过对话生成网页,可一键发布。主力支持 shadcn/ui (React) + Tailwind 技术栈,后续会支持更多前端技术栈。有免费配额。
    • Wegic:AI 驱动的网页 UI 设计和开发工具。通过自然对话快速生成网站,可通过对话持续修改,可一键发布。
    • OpenUI:开源项目,AI 自动生成前端代码。可根据描述生成 UI 界面,且可以持续输入描述进行修改,可输出 HTML、React、Vue 组件等格式。支持输入中文描述。在线演示
  • 其他工具:
    • CopyCoder:把网页设计稿、原型图转换成适合 AI 编程工具处理的提示词,适合与 Cursor、Windsurf、Bolt.new、v0.dev 等工具配合使用。
    • Devin:Cognition Labs 推出的 AI 编程机器人,有很强的自主学习和工作能力。内测申请排队中,还未正式开放。
    • Gru.ai:一款在线的编程助手 AI Agent,根据用户的任务生成代码,支持 Python 和 TS 语言。
  • 书籍推荐:

AI 绘画 / 音频视频创作  

AI 绘画

  • Midjourney :是一款热门的 AI 绘画工具,早期依托 Discord 平台提供服务,现已推出独立网页版应用。它易于入门,作品风格华丽,适合初学者探索 AI 艺术创作,创造独特的视觉作品。

    • 定价:
      • 基础版套餐(3.3h Fast Time):$10 / 月
      • 标准版套餐(15h Fast Time + Unlimited Relax Time):$30 / 月
      • 专业版套餐(30h Fast Time + Unlimited Relax Time):$60 / 月
      • 至尊版套餐(60h Fast Time + Unlimited Relax Time):$120 / 月
  • OpenAI DALL·E :OpenAI 出品的图片生成工具。对提示词的理解能力极强,与 ChatGPT 的整合也令它极为易用。

  • Stable Diffusion :是一款先进的人工智能图像生成模型,由 Stability AI 开发。可本地部署。因其开源特性,发展迅速,已经成长为一个庞大的生态,广泛应用于艺术创作、设计和多媒体制作等领域。

  • FLUX.1:是一个全新的开源图像生成模型。它由 Black Forest Labs 开发,该团队也是 Stable Diffusion 的幕后团队。

AI 视频生成

  • Runway Gen-2:视频生成领域的热门产品。它提供了多种 AI 视频生成模型,包括文生视频、图文生成视频、图生视频、风格化渲染、局部叠加渲染、3D 模型渲染等功能。有免费额度。官网
  • Pika:视频生成领域的热门产品,典型功能为图生视频。新版本主打趣味视频生成功能。有免费额度。
  • PixVerse:视频生成工具,支持文生视频、图生视频、人物生成视频等。有免费额度。
  • Stable Video Diffusion:Stability AI 发布的开源的视频生成模型。可本地部署。
  • OpenAI Sora:OpenAI 发布的视频生成模型。可实现文生视频、图生视频、视频延长和衔接。生成视频长达一分钟。目前仅面向安全领域和创作领域的专家开放内测,还没有正式开放。
  • 可灵大模型 / 可灵AI:快手出品的视频生成大模型,支持文生视频、图生视频、视频续写等能力。支持最长 3 分钟高清视频生成,堪称 “中国版 Sora”。
  • 智谱清影:智谱 AI 推出的视频生成工具,支持文生视频、图生视频等功能,比如 “老照片动起来” 等应用。可生成 10 秒、4K 分辨率、60 帧高清视频。目前免费开放,支持 API 调用。
  • Vidu:Vidu 是由清华大学朱军教授团队研发的 AI 视频生成器。支持生成高逼真度的 4 秒或 8 秒 1080p 高清视频。亮点包括生成速度快、角色一致性、支持写实和动漫风格、生成效果连续流畅等,可应用于游戏、影视、教育等领域。
  • Luma Dream Machine:Luma AI 出品的视频生成模型。支持文生视频、图生视频,可生成 5 秒长度的视频。有免费额度。
  • 剪映专业版(国内版) / CapCut(海外版):字节跳动出品的视频编辑工具,支持 Windows/Mac。它集成了大量基于 AI 技术的音视频处理功能,比如生成字幕、生成配音、降噪、变声、数字人、文生视频等等。

3D 建模

  • Zero-1-to-3 (zero123): Zero-shot 单张图片生成 3D 物体。哥伦比亚大学的开源项目。
  • One-2-3-45:“Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization”。开源项目。
  • Wonder3D:“Wonder3D produces consistent multi-view normal maps and corresponding color images, and thus reconstructs high-fidelity textured mesh from a single image in only 2~3 minutes”。开源项目。
  • Stable Zero123:单张图片生成高质量 3D 物体。Stability AI 开源模型,可整合到 ComfyUI 工作流。
  • DreamGaussian:Generative Gaussian Splatting for Efficient 3D Content Creation。开源项目。
  • Tripo AI:通过文本或图片生成高质量 3D 模型,可下载。有免费配额。
  • Genie:Luma AI 出品的一款通过文本生成 3D 模型的 AI 工具。目前依托 Discord 提供服务。
  • Luma AI:通过视频来重建 3D 场景。你只需要有一台手持拍摄设备,按要求对物体进行 360°旋转拍摄。有网页版和 iOS App。

数字人 / 语音驱动视频 / TTS

TTS:Text to Speech,文本生成语音。

  • 万兴播爆:输入文案,一键生成数字人播报视频。
  • 剪映:可生成数字人播报视频。
  • HeyGen:生成数字人播报视频,视频翻译,语音克隆。
  • Eleven Labs:文本转语音(TTS),通过文字描述生成音效,语音克隆,视频翻译配音。有 API。
  • EMO:阿里发布的(图片 + 音频 → 视频)大模型,生成的人物嘴形和表情相当自然。
  • ChatTTS:开源的文本转语音(TTS)模型,支持中文和英文。可以控制停顿和笑声等人性化特征,生成结果自然流畅。
  • Seed-TTS:字节跳动发布的高质量、多功能语音生成模型,未开源,似乎也没有发布可用的产品。支持音色微调、带情绪的 TTS、音色转换、情绪转换、基于原语音生成新语音、语音内容编辑、调速等能力。可应用于有声读物、翻译视频等场景。
  • 剪映:已上线 AI 克隆音色的功能,只能克隆自己的音色。
  • 微软 Azure AI 语音:微软的云服务,支持语音转文本、文本转语音、语音翻译和说话人辨识等功能。
  • LivePortrait:快手开源的人物肖像控制模型,可通过五官视频驱动图片生成视频,或修改其他视频。在线体验
  • ReSyncer:一个研究项目,通过语音和视频模板素材,生成更自然的唇形视频。可应用于数字人场景。目前只有研究论文,还没有公开可用的产品。
  • MaskGCT:香港中文大学(深圳)与趣丸科技合力打造的最新一代语音克隆模型,已开源,具备零样本 TTS 能力(只需 1 秒声音样本即可克隆)。在线试用

在线 SD 绘画

  • Leonardo.Ai:易用且强大的 AI 绘图平台,底层基于 SD,深度集成 SD 各种插件,提供训练好的模型,可训练模型。有免费配额。
  • eSheep 电子羊:体验在线的 WebUI 和 ComfyUI。新用户获得 100 积分。每 100 积分相当于 ¥1。
  • 网易 AI 设计工坊:在线 WebUI,可训练模型。有免费配额,每天 10 次。
  • LibLib AI:在线 WebUI,可训练模型。有免费配额,每天 300 积分。
  • Cephalon Cloud 端脑云:云端一键部署自己的 WebUI 和 ComfyUI。新用户获得 2000 积分。每 1000 积分相当于 ¥1。
  • 即梦 AI:字节跳动出品的在线绘画平台,主打易用和免费。原名 “Dreamina”。

音乐歌曲创作

  • Suno:AI 根据你的要求生成歌曲(作词、作曲、演唱)。
  • 天工 AI 音乐:根据歌名、歌词、参考音频创作音乐,可由 AI 帮写歌词。

其他创作工具

  • 神采 / PromeAI:图片生成和编辑工具,包括草图渲染、照片转线稿、局部重绘、抠图去背景、换背景、扩图、重打光、高清放大、文字融合、AI 写真、图生视频等。有免费配额。
  • DomoAI:视频风格转绘,比如把一段现有视频转换为二次元日漫、像素风、油画、3D 皮克斯动画等风格。此外还有文生图、图生图、图生视频等功能。有免费配额。
  • Comic AI:AI 漫画制作工具。有免费配额。
  • Logo Diffusion:AI 设计 Logo 工具,主要功能有:提示词生成 Logo、图片转 Logo、用提示词修改 Logo、手绘草稿美化、2D 转 3D。有免费配额。
  • AutoPod:Premiere Pro 插件,自动完成多机位剪辑、停顿切除。
  • Canva 可画:老牌的在线设计工具,提供了大量模板和设计元素,支持 AI 设计。
  • FaceSwap:多功能的在线换脸工具。支持图片换脸、多人换脸、视频换脸等功能。有免费配额。
  • Remaker - Face Swap Online Free:免费的在线换脸工具,支持图片换脸。
  • 绘蛙:面向电商领域的 AI 模特换装生图工具。阿里出品。

(持续更新中……)

常用 AI 网站 / 工具  

综合平台

  • POE:各种知名模型的聚合平台。用户可根据自己的需求通过 Prompt 定制对话机器人,相当于 GPTs 平替。付费用户可无限量使用 GPT-4、Claude 2 等高端模型。
  • FlowGPT:一个 Prompt 分享平台。提供了角色聊天、游戏、创意、生产力等各种类型的对话机器人,是一个学习提示词的好地方。也可以把它当作 GPTs 平替。
  • Character.AI:与各种类型的 AI 虚拟角色对话,包括世界名人、动漫人物、游戏角色等。
  • Coze:字节跳动推出的 AI 聊天机器人及 AI 应用开发平台。无论是否具备编程基础,用户都可以快速构建特定功能的聊天机器人,并发布到各大社交平台。
  • GPTsCopilot:第三方 GPTs 商店,提供 GPTs 中转访问服务。在 GPTs 的网址中,把 openai.com 改成 openai-now.com 就可以切换到 GPTsCopilot 提供的中转访问服务,无需成为 ChatGPT Plus 会员即可使用 GPTs。
    • 定价:https://gptscopilot.ai/pricing
      • 基础版(每天 5 积分):免费
      • 专业版(每月 1500 积分):$9.99 / 月
      • 按需付费方案:$5.99 / 500 积分 或 $9.99 / 1000 积分
  • Toolify.ai:AI 工具分类导航目录。
  • There's An AI For That (TAAFT):提问我的需求可以用哪些 AI 工具来实现。
  • 通往 AGI 之路 / WayToAGI:AI 工具(包含网站和 GPTs)分类导航目录,也可搜索。
  • ChandlerAi:国内可用的 AI 助手,可调用 GPT-4、Claude 3 Opus、Gemini、DALL·E 等先进模型。需要付费。

图像处理 / 图形设计 / UI 设计

  • Vectorizer.AI:基于 AI 的位图转矢量图的在线工具,比如 PNG → SVG。已经不可免费使用,需要订阅($10 / 月)。
  • Galileo:通过提示词生成 UI 设计稿,可导出到 Figma。
    • 定价:https://www.usegalileo.ai/pricing
      • 免费版(注册后获得 200 积分 + 3 次导出):免费
      • 标准版(每月 1200 积分 + 无限导出):$19 / 月
      • 专业版(每月 3000 积分 + 无限导出 + 私密模式):$39 / 月
  • Magnific AI:图片放大,增强细节。
  • Photoroom:在线 AI 图片处理工具。免费用户可使用抠图、擦除、照片优化功能。
  • 抠图:

写作 / PPT 幻灯片

  • Notion AI:Notion 中的 AI 写作助手。增值服务,每月 $10。
  • 蛙蛙写作:国产写作模型,写长篇小说、视频脚本、论文等。免费试用 3000 字。
  • 讯飞智文:Word、PPT 一键生成、AI 撰写助手、多语种互译、AI 自动配图、PPT 转演讲稿等。
  • 腾讯文档:AI 助手提供生成 PPT、生成文档、生成表格、生成思维导图、生成收集表等功能。
  • Gamma:AI 设计助手,生成 PPT、文档和网页,优化现有 PPT 和文档。
  • AiPPT.cn:AI 一键生成 PPT。支持自动生成 PPT 大纲文案,文档秒变 PPT,支持多种模板,兼容 pptx 格式。

内容分析、识别、提炼

  • 通义听悟:语音文件识别为文本,拆分章节,提炼关键信息,识别多人发言,适合处理录音采访、播客、会议记录等内容。
  • MinerU:一站式、开源、高质量的数据提取工具,包含 PDF 文档、网页与电子书的内容提取并转换等 Markdown 等功能。在线体验
  • Elicit:以超人速度分析论文。自动化耗时的研究任务,如总结论文、提取数据和汇总结论。
  • Monica:多功能 AI 工具箱,有浏览器插件、桌面应用和移动 App。最为人熟知的功能是基于网页内容的总结和问答。
  • 剪映:可识别语音生成字幕。

定制知识库 / RAG

RAG:Retrieval-Augmented Generation,检索增强生成。是目前基于 LLM 实现 “外挂知识库” 的主流技术方案。

  • SiteGPT:基于你的官网内容和上传文档创建客服机器人,解答客户的咨询。
  • Dify:LLM 应用开发平台,支持各种大模型,提供 Prompt 编排、RAG、Agent 框架、工作流编排等功能。
  • RAGFlow:一款基于深度文档理解构建的开源 RAG 引擎。
  • MaxKB:基于 LLM 大语言模型的知识库问答系统。开箱即用,支持快速嵌入到第三方业务系统。

广告 / 营销

  • AdIntelli:面向 GPTs 生态的广告联盟(可靠性待验证)。
  • GPT Wallets:为 GPTs 提供支付和数据分析解决方案。

API 聚合平台

  • GitHub Models:GitHub 提供的免费 LLM API,包含 GPT-4o、Meta Llama 3、Cohere 等模型,调用频率有限制。相关攻略
  • API2D:提供 GPT 系列、Claude、嵌入、绘图等 API,高速稳定,支付便捷。
  • OpenRouter:提供 GPT、Claude、Gemini、Llama、Qwen 等系列 API 服务。

其他工具 / 开源项目

  • Perplexity:AI 搜索。
  • 秘塔 AI 搜索:更友好的搜索引擎,帮你整理信息后更有条理地呈现。有 “全网” 和 “学术” 两种搜索模式,搜索深度可选简洁、深入、研究。
  • 天工 AI:AI 搜索、对话助手等。
  • PromptPerfect:帮你优化提示词(Prompt)。比如把你的笼统需求拆解为多步骤的任务,以提高模型输出的准确性;又比如根据给定的文章主题生成大纲并撰写长文。
  • AppAgent:腾讯研究团队的开源项目,基于大语言模型的手机端多模态智能代理,帮用户自动执行复杂任务。适用于 Android 手机和模拟器。可粗略类比为手机端的按键精灵。
  • ProctorAI:AI 监工,号称 “拖延症终结者”。开源项目,本地应用程序,通过定时截图来检查你是否在摸鱼,并发出警告,支持语音提醒。可以设置详细的监督规则。底层调用了 GPT-4o 等多模态模型。
  • llm_aided_ocr:LLM 辅助 OCR,通过大模型来提升 OCR 的准确性。

教程

法规 / 公告

(持续更新中……)


常见问题  

有什么简便的方式可以使用 GPT-4 和 GPTs?  

建议先通过 ChatGPT Plus 拼车账号开始体验,即买即用。解锁 GPT-4 + DALL·E 绘图 + GPTs 等高端功能。需自备海外线路。

这里推荐一个老牌的拼车平台,稳定可靠。点此开始拼车(还可用九五折优惠码 ai2024)。

AI 生成内容的版权(著作权)属于谁?

简单说一下结论:

  • 如果 AI 服务商的用户协议中主张了 AI 生成内容的著作权,则属于 AI 服务商。
  • 否则属于使用 AI 服务生成内容的用户。

详细解释:你用 AI 生成的作品,版权归你吗?

微信群  

加入群,快人一步获取 AI 资讯、与数百名同好交流:

qun-qr


License

  • Text and graphics: © Creative Commons BY-NC-ND 4.0
  • Code: GPLv3