介绍一些好玩且实用的开源的AI工具
随着人工智能技术的迅猛发展,开源社区涌现出了许多关于AI的项目,这些项目不仅展示了技术的创新力,也为开发者提供了丰富的工具和资源。本文将介绍几个既有趣又实用的开源人工智能工具,它们不仅能够帮助你加深对人工智能技术的理解,还能在实际应用中大显身手。
Open AI-Cook Book
Open AI-Cook Book 是一本 Open AI 的 API 使用指南,提供了一些通过 Open AI 的 API 搭建任务的示例代码。
Github:https://github.com/openai/openai-cookbook
官方文档请访问:https://cookbook.openai.com/
动手学大模型应用开发(中文)
Github:https://github.com/datawhalechina/llm-universe
官方文档:https://datawhalechina.github.io/llm-universe/
本项目是一个面向小白开发者的大模型应用开发教程,旨在基于阿里云服务器,结合个人知识库助手项目,通过一个课程完成大模型开发的重点入门,主要内容包括:
1. 大模型简介,何为大模型、大模型特点是什么、LangChain 是什么,如何开发一个 LLM 应用,针对小白开发者的简单介绍;
2. 如何调用大模型 API,本节介绍了国内外知名大模型产品 API 的多种调用方式,包括调用原生 API、封装为 LangChain LLM、封装为 Fastapi 等调用方式,同时将包括百度文心、讯飞星火、智谱AI等多种大模型 API 进行了统一形式封装;
3. 知识库搭建,不同类型知识库文档的加载、处理,向量数据库的搭建;
4. 构建 RAG 应用,包括将 LLM 接入到 LangChain 构建检索问答链,使用 Streamlit 进行应用部署
5. 验证迭代,大模型开发如何实现验证迭代,一般的评估方法有什么;
Github:https://github.com/datawhalechina/self-llm
《开源大模型食用指南》基于Linux环境快速部署开源大模型,更适合中国宝宝的部署教程
本项目是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。
Stable Diffusion web UI
Github:https://github.com/AUTOMATIC1111/stable-diffusion-webui
使用 Gradio 库实现的 Stable Diffusion的 Web 界面,STAR数:135k+
Stable Diffusion 是一种神经网络模型,专门用于生成图像。这个项目提供了一个Web界面,使用户能够直观地与稳定扩散模型进行交互和使用。通过这个界面,用户可以上传图像或调整参数,然后观察模型生成的图像输出。这种界面通常使得复杂的深度学习模型更易于使用和测试,适用于艺术创作、图像编辑等应用场景。
AI 换脸工具
Github:https://github.com/iperov/DeepFaceLive
AI 换脸工具 适用于视频聊天的 AI 换脸模型,你可以使用这个 AI 模型替换摄像头中的面部或视频中的面部。
目前仓库不再更新, 2023 年 11 月 9 日存档,它现在是只读的。
Danswer
Github:https://github.com/danswer-ai/danswer.git
Danswer 是一个开源企业问答工具。当你使用 Danswer 时,只需以自然的方式提出问题,就像与朋友交谈一样简单,它会自动搜索公司内部的文件和资料,然后给你一个可靠的答案,并附上来源。除此之外,Danswer 还可以和其他常用的工具一起使用,比如 Slack、GitHub、Confluence 等。这样你可以更方便地获取答案,同时也可以和团队成员一起分享和讨论。
功能特性
• answer 提供直接问答功能,它由生成式 AI 模型驱动,所得答案都有引用和来源链接支持。
• 智能文档检索采用最新的 LLMs 进行语义搜索和重新排序。
• AI 助手由定制的深度学习模型支持,可以解释用户意图。
• 已包含用户认证和文档级别的访问管理功能。
• 可以连接到 Slack、GitHub、GoogleDrive、Confluence、本地文件和网络爬虫等,未来还会添加更多连接方式。
• 管理仪表盘可以管理连接器,并设置功能,比如实时更新获取。
• 只需一行 Docker Compose(或 Kubernetes)命令,即可在任何地方部署 Danswer。
Github:https://github.com/wzpan/wukong-robot
官网:https://wukong.hahack.com/
wukong-robot 是一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持ChatGPT多轮对话能力,还可能是首个支持脑机交互的开源智能音箱项目。
mi-gpt
Github:https://github.com/idootop/mi-gpt
将小爱音箱接入 ChatGPT 和豆包,改造成你的专属语音助手。
在这个数字化的世界里,家已不仅仅是一个居住的地方,而是我们数字生活的延伸。
MiGPT 通过将小爱音箱、米家智能设备,与 ChatGPT 的理解能力完美融合,让你的智能家居更懂你。
MiGPT 不仅仅是关于设备自动化,而是关于:打造一个懂你、有温度、与你共同进化的家。
未来,你的每个智能家居设备,从灯泡、插座,到扫地机器人、电视等,
都可以作为一个个独立的智能体 (Agent),更智能、更贴心的响应你的指令。
这些独立的智能体,也可以彼此感知,彼此配合,构成一个更强大的协作网络。
而小爱音箱就像是你的智能家居专属管家,全心全意为你服务,释放智能家居的真正潜力。
MaxKB
Github:https://github.com/1Panel-dev/MaxKB
官方文档:https://maxkb.cn/
文档:https://maxkb.cn/docs/
飞致云旗下开源产品,基于 LLM 大语言模型的知识库问答系统
• 开箱即用:支持直接上传文档、自动爬取在线文档,支持文本自动拆分、向量化、RAG(检索增强生成),智能问答交互体验好;
• 模型中立:支持对接各种大语言模型,包括本地私有大模型(Llama 3 / Qwen 2 等)、国内公共大模型(通义千问 / 智谱 AI / 百度千帆 / Kimi / DeepSeek 等)和国外公共大模型(OpenAI / Azure OpenAI / Gemini 等);
• 灵活编排:内置强大的工作流引擎,支持编排 AI 工作过程,满足复杂业务场景下的需求;
• 无缝嵌入:支持零编码快速嵌入到第三方业务系统,让已有系统快速拥有智能问答能力,提高用户满意度。
现代化设计的开源 ChatGPT/LLMs 聊天应用与开发框架,支持语音合成、多模态、可扩展的(function call)插件系统,一键免费拥有你自己的 ChatGPT/Gemini/Claude/Ollama 应用
Github:https://github.com/lobehub/lobe-chat
中文:https://github.com/lobehub/lobe-chat/blob/main/README.zh-CN.md
ChatGPT-Next-Web
Github:https://github.com/ChatGPTNextWeb/ChatGPT-Next-Web
中文:https://github.com/ChatGPTNextWeb/ChatGPT-Next-Web/blob/main/README_CN.md
演示:https://app.nextchat.dev/
A cross-platform ChatGPT/Gemini UI (Web / PWA / Linux / Win / MacOS). 一键拥有你自己的跨平台 ChatGPT/Gemini 应用。
一键免费部署你的私人 ChatGPT 网页应用,支持 GPT3, GPT4 & Gemini Pro 模型。
GeminiPro-Next-Web
Github:https://github.com/lchh5/GeminiPro-Next-Web
中文:https://github.com/lchh5/GeminiPro-Next-Web/blob/main/README_CN.md
演示:https://chat.googlegemini.co/
一键免费部署你的跨平台私人 Gemini 应用, 支持Gemini Pro 模型,基于 ChatGPT Next Web。
simple-one-api
Github:https://github.com/fruitbars/simple-one-api
OpenAI 接口接入适配,支持千帆大模型平台、讯飞星火大模型、腾讯混元以及MiniMax、Deep-Seek,等兼容OpenAI接口,仅单可执行文件,配置超级简单,一键部署,开箱即用. Seamlessly integrate with OpenAI and compatible APIs using a single executable for quick setup and deployment.
目前市面上免费的使用国产的免费大模型越来越多,one-api对于个人用起来还是有点麻烦,就想要一个不要统计、流量、计费等等的适配程序即可。
还有一点是:即使有些厂商说兼容openai的接口,但是实际上还是存在些许差异的!!!
simple-one-api主要是解决以上2点,旨在兼容多种大模型接口,并统一对外提供 OpenAI 接口。通过该项目,用户可以方便地集成和调用多种大模型,简化了不同平台接口差异带来的复杂性。
Noi
Github:https://github.com/lencx/Noi
官网:https://noi.nofwl.com/zh-CN/
中文介绍:
ChatGPT、Gemini、Poe等AI桌面应用工具(适用于 Mac、Windows 和 Linux)
ChatTTS
Github:https://github.com/2noise/ChatTTS
中文:https://github.com/2noise/ChatTTS/blob/main/docs/cn/README.md
一款适用于日常对话的生成式语音模型。
亮点
你可以参考 Bilibili 上的这个视频,了解本项目的详细情况。
1. 对话式 TTS: ChatTTS 针对对话式任务进行了优化,能够实现自然且富有表现力的合成语音。它支持多个说话者,便于生成互动式对话。
2. 精细的控制: 该模型可以预测和控制精细的韵律特征,包括笑声、停顿和插入语。
3. 更好的韵律: ChatTTS 在韵律方面超越了大多数开源 TTS 模型。我们提供预训练模型以支持进一步的研究和开发。
Github:https://github.com/panyanyany/Awesome-ChatTTS
ChatTTS资源大全,免费体验地址,音色库等
MiniGPT-4
Github:https://github.com/Vision-CAIR/MiniGPT-4
官网:https://minigpt-4.github.io/
MiniGPT-4 中文部署翻译:https://github.com/RiseInRose/MiniGPT-4-ZH
MiniGPT-4: 使用先进的大型语言模型增强视觉语言理解
所属机构为沙特阿拉伯国王科技大学
facechain
Github:https://github.com/modelscope/facechain
中文简介:https://github.com/modelscope/facechain/blob/main/README_ZH.md
FaceChain是一个可以用来生成个人写真的深度学习模型工具。在最新的FaceChain FACT版本中,用户仅需要提供一张照片即可10秒钟获得独属于自己的个人写真(支持多种风格)。FaceChain可实现兼具可控性与ID保持能力的无限风格写真与固定模板写真功能,同时对ControlNet和LoRA具有优秀的兼容能力。FaceChain支持在gradio的界面中使用模型训练和推理能力、支持资深开发者使用python脚本进行训练推理,也支持在sd webui中安装插件使用。
Open-Sora
Github:https://github.com/hpcaitech/Open-Sora
中文:https://github.com/hpcaitech/Open-Sora/blob/main/docs/zh_CN/README.md
官网:https://hpcaitech.github.io/Open-Sora/
Open-Sora:让所有人都能轻松制作高效视频。
我们设计并实施了Open-Sora,这是一项致力于高效制作高质量视频的计划。我们希望让所有人都能使用模型、工具和所有细节。通过采用开源原则,Open-Sora 不仅使高级视频生成技术的使用变得民主化,而且还提供了一个简化且用户友好的平台,简化了视频生成的复杂性。借助 Open-Sora,我们的目标是在内容创作领域促进创新、创造力和包容性。
今天的推荐就到这里,也是搜集了几个月的开源AI工具,躺在谷歌浏览器的书签中,有机会再出几个教程在本地或者云上部署这几个开源的AI工具。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.