文章插图
由Deepgram的官方介绍文档可知(https://developers.deepgram.com/docs/introduction),它提供了免费和可视化两种模型 。其免费层面完全能够满足您的基本使用 。而可视化是上面一层,您可以查看实时的流媒体响应或音频文件 , 并比较音频的智能化水平 。
文章插图
文章插图
您还可以阅读Deepgram的博客示例(https://deepgram.com/learn/how-to-add-speech-recognition-to-your-react-project),以获悉如何在React和Node.js项目中添加语音识别功能 。
如果您想亲自体验Deepgram API的灵活性,请访问它们的API Playground(https://playground.deepgram.com/?smart_format=true&language=en&model=nova-2) 。7.InvokeAI -稳定扩散模型的领先创意引擎
文章插图
作为Stable Diffusion的实现 , InvokeAI(https://github.com/invoke-ai/InvokeAI)是一种开源的文本到图像、以及图像到图像的生成器 。它提供了业界领先的WebUI,并通过CLI支持终端的使用,可谓多种商业产品的基础 。
InvokeAI既能够在windows、mac和linux机器上运行,也可以在仅有4 GB内存的GPU显卡上运行 。您可以阅读其有关硬件要求(https://invoke-ai.github.io/InvokeAI/installation/INSTALLATION/),如何安装不同的模型(https://invoke-ai.github.io/InvokeAI/installation/050_INSTALLING_MODELS/) , 以及重要的自动安装信息(https://invoke-ai.github.io/InvokeAI/installation/010_INSTALL_AUTOMATED/) 。
文章插图
正如其文档(https://invoke-ai.github.io/InvokeAI/features/IMG2IMG/)所述,InvokeAI还能够使用其他图像来生成新的图像 。
目前,InvokeAI在GitHub上有将近两万一千多颗星 。8.OpenAI- 您需要的一切
文章插图
OpenAI(https://github.com/openai)已被全世界所知晓 。通过OpenAI , 您可以使用DALL-E来根据文字描述,创建原始、逼真的图像,使用Whisper实现语音识别模型 。
如下代码段所示,您可以从一个简单的API开始构建 。
completion = openai.ChatCompletion.create(model="gpt-3.5-turbo",messages=[{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "What are some famous astronomical observatories?"}])
当然,其文档链接-- https://platform.openai.com/docs/introduction提供了更多可构建的选项 。文章插图
如上图所示,您可以创建助理应用(https://platform.openai.com/docs/assistants/overview)程序并查看API playground(https://platform.openai.com/playground/p/default-chat?model=text-davinci-003),以便更好地了解它 。
文章插图
9.DeepFaceLab -用于创建Deepfakes的领先软件DeepFaceLab(https://github.com/iperov/DeepFaceLab)是一款实现深度伪造(Deepfakes)的顶级开源工具 。此处的深度伪造是利用深度学习来篡改图像和视频的技术 。它们经常被用来在图片或短片中调换人脸,有时是为了开玩笑,但有时是为了欺诈 。
文章插图
如上图所示,作为一款使用Python构建的深度伪造工具,DeepFaceLab可以改变媒体中的人脸,消除皱纹和衰老的痕迹,甚至可以操纵嘴唇的动作 。
您既可以使用其基础教程来了解如何有效地使用DeepFaceLab(https://www.YouTube.com/watch?v=kOIMXt8KK8M),也可以通过链接观看DeepLab算法的使用视频(https://www.youtube.com/channel/UCGf4OlX_aTt8DlrgiH3jN3g/videos) 。
遗憾的是,在DeepFaceLab中并没有“使一切正常”的按钮 。不过,您可以通过学习其工作流程,以满足自己的特定需求 。而且,由于教程众多、算法可靠,因此它已是人工智能应用领域的可靠选择 。
截止2023年11月9日,DeepFaceLab已在GitHub上拥有近四万四千颗星 。10.Detectron2 -基于PyTorch的模块化对象检测库
文章插图
作为Facebook AI Research的下一代代码库,Detectron2支持Facebook上的多个计算机视觉研究项目和生产应用 。它是 Detectron和maskrcnn-benchmark的后续产品 , 因此提供了最先进的物体检测和分割算法模型 。同时,Detectron2也能适应不断发展的前沿研究领域 。
推荐阅读
- cdr填充怎么样进行操作,cdr交互式填充工具怎么选择颜色
- cdr软件如何使用刻刀工具,cdr咋得才可以使用裁剪工具
- ps怎么用钢笔工具画弧线
- 哪位科学家发现动物使用工具
- Ai咋滴才可以将字体变成倾斜,ai使用什么工具可以倾斜对象
- cdr透明度工具不见了,cdr透明度应该咋滴才能调
- 画图工具要怎样才可以调图片的大小
- cdr咋滴才能倒角,cdr如何用形状工具给矩形倒圆角
- cdr有模糊工具,cdr咋滴才能羽化
- ps咋用钢笔工具画弧线