随着AI技术的持续发展，2024年迎来了AI元年。AI（Artificial Intelligence）又称人工智能，用于模拟、延伸、扩展人的智能理论、方法、技术的科技革命。毫不夸张的说它是继蒸汽机时代、电气时代、信息时代后的第四次工业革命。目前有两个比较引人注目的分支AGI和AIGC。AGI（Artificial General Intelligence）一般指通用人工智能，可以完全模仿人类的行为，可以实现自我学习、自我改进、自我调整。AIGC（Artificial Intelligence Generated Content）生成式人工智能，比较有代表性的是OpenAI发布的ChatGPT、Sora，今天主要推荐一些AIGC的免费工具及网站。

前言

其实早在20世纪50年代就提出了人工智能（AI）一词，确切日期为1956年。但真正引爆点不得不说的是OpenAI发布的首个生成式对话大模型ChatGPT之后。ChatGPT能够完成脚本、论文、文案、邮件的撰写，翻译工作以及生成代码等任务。显然，它在许多方面明显优于传统的搜索业务。目前，该模型已经升级至GPT-4。随后，国内也涌现出类似的对话大模型，如百度的文心一言、阿里巴巴的通义千问、科大讯飞的讯飞星火、腾讯的混元大模型以及华为的盘古大模型等等，但已跟ChaGPT拉开较大距离。尤其是今年2月年后，OpenAI发布了具有划时代意义的AI产品，文生视频工具——Sora，用华为的广告词名副其实真可谓“遥遥领先”。

2024年我推荐的大语言模型除了ChatGPT，还有谷歌最近终于发力的Gemini。

Gemini

Gemini是Google Deepmind最新、最强大的AI模型。它原生支持多模态，具备跨模态推理能力，包括文本，图像，视频，音频和代码。它包含了 3 个不同版本：Ultra、Pro 和 Nano，分别对应不同的使用场景和需求。Gemini Ultra 可以理解为 Gemini 的完全体，在稍前的测试中，通用、推理、数学、编码等能力的多个基准测试中，Gemini Ultra 都略优于 GPT-4。但在奥秘实际使用测试中，无论是Gemini或是微软的Copilot，都和GPT4稍有差距。

使用与美友好的国家IP可以直接登录使用。

项目地址：https://gemini.google.com/

ChatGPT

ChatGPT4月2日进一步降低了使用门槛，其3.5模型现在支持免登录永久免费使用。只需有个干净的IP即可。当然如果你有服务器，也可以使用API自己搭建个服务端。推荐下面文章里的几个开源项目。

ChatGPT & OpenAI Keys 注册及保姆级使用教程

1年前

8117911

项目地址：https://chat.openai.com/

白嫖ChatGPT- 4.0教程

前往字节跳动旗下海外代码平台Coze网站通过手机或邮箱注册账号并登录。

注册地址：https://www.coze.com/

按步骤创建机器人，可以翻译成中文进行操作。

选择GPT模型

根据自己的需求添加功能插件，数据分析，图片识别，文生图片，文生视频……等等众多功能。

根据你选择的插件，实现各种功能。示例使用界面

Suno——文生音乐

Suno AI是一款生成式音频AI工具，它由音乐和人工智能领域的专家开发，可以根据用户的文本生成音乐。它使用了最新的深度学习和自然语言处理技术，可以从用户输入的歌词中理解用户的意思，并生成一首以用户指定的曲风和音乐特性为基础的原创歌曲。

当然也可以自定义歌词、曲风、歌名，前奏、主歌、副歌、和声等等。

项目地址：https://suno.com/

Tenso——文生图

谈起文生图，你或许知道Midjourney、DALL-E3、SDXL Turbo、或是Leonardo，但今天推荐的这款工具却有其他AI所不具备的独有优势。从何说起呢，此款工具免费，每天登录即可获取免费算力，足够你折腾的。最重要的有很多喜欢艺术学习的朋友，可以用它来生成各类学习材料。选的模型越真实，生成的学习材料也越真实。

更多艺术示例图不适宜展示，自己发掘吧。

项目地址：https://tensor.art/

填入邀请码获取额外算力：

此处内容已隐藏，请评论后刷新页面查看.

Sora——文生视频

2024年2月，OpenAI 发布首个文生视频模型，它能够根据文本指令创建长达60秒的视频，这些视频不仅逼真，而且包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。他就是Sora，它不仅能够理解用户在提示中所要求的内容，还理解这些内容在物理世界中的存在方式。

Sora到底强不强，去他的官网看一看你一定能找到答案。尽管Sora还没有开放公测，但不可否认它已经震惊了世界。

项目地址：https://openai.com/sora

说明：早些时候“中国AI第一人”通过制造和放大公众焦虑，收割民众相信给很多朋友带来了困扰。本帖将持续更新，勉强算科普吧。

GPT-4o

就在昨天OpenAIOpenAI 发布了最新旗舰大模型 GPT-4o，限时免费使用，功能涵盖听觉、视觉和语音，体验丝滑流畅毫无延迟，仿佛在进行一次视频通话。

直播回放：https://www.youtube.com/embed/DQacCB9tDaw?si=dFaQXog3ierHF4zt

直播效果更是惊艳：它能感知你的呼吸节奏，并用更加丰富的语气实时回应，甚至可以在适当时打断对话。

GPT-4o 中的 “o” 代表 Omni，即 “全能”，能够接受文本、音频和图像的任意组合输入，并生成相应的输出。

响应速度快至 232 毫秒，平均 320 毫秒，与人类对话反应速度一致。

这是一次馈赠所有人的大礼，GPTo 与 ChatGPT Plus 会员版的所有功能，包括视觉、联网、记忆、执行代码、GPT Store 等，都将免费开放！

（新语音模式将在几周内优先向 Plus 用户开放）

在直播现场，CTO Murati 谦虚地表示：这是将 GPT-4 级别的模型开放给大家。

研究员 William Fedus 揭秘，GPT-4o 是之前在大模型竞技场进行 A/B 测试的模型之一，名为 im-also-a-good-gpt2-chatbot。

无论是用户体验还是竞技场排名，GPT-4o 都超过了 GPT-4-Turbo 级别模型，ELO 分数遥遥领先。

本页内容已结束·点赞收藏不迷路

1 本站名称：奥秘博客
2 本站永久网址：https://www.omii.top
3 本网站文章部分内容来源于网络，仅供大家学习与参考，如有侵权，请联系站长处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6 本站资源大多存储在云盘，如发现链接失效，请邮件联系我们会第一时间更新。

THE END

技术教程资源分享
# Gemini # Sora

谢各位老爷们打赏。

评论共9条

请登录后发表评论

登录注册

只看作者

- sathew0
  现在AI很牛啊
  28天前广东回复
- 用户634018900
  感谢楼主分享
  29天前美国回复
- axper20110
  羡慕你这该死的才华
  29天前青海回复
- soulwave0
  能够自己PS图片吗？
  33天前回复
- fgn31nuq700
  学习使我快乐，感谢大佬分享知识！
  33天前湖北回复
- 用户876643230
  Tenso用代理进不去
  33天前英国回复
- - OMii作者0
    换个梯子
    33天前广东@用户87664323回复
- 用户876643230
  好东西，学习一下
  33天前浙江回复
- Macherami-o0
  我来看看
  33天前河南回复

2024人工智能AIGC工具使用推荐

前言