2024人工智能AIGC工具使用推荐

随着AI技术的持续发展,2024年迎来了AI元年。AI(Artificial Intelligence)又称人工智能,用于模拟、延伸、扩展人的智能理论、方法、技术的科技革命。毫不夸张的说它是继蒸汽机时代、电气时代、信息时代后的第四次工业革命。目前有两个比较引人注目的分支AGI和AIGCAGI(Artificial General Intelligence)一般指通用人工智能,可以完全模仿人类的行为,可以实现自我学习、自我改进、自我调整。AIGC(Artificial Intelligence Generated Content)生成式人工智能,比较有代表性的是OpenAI发布的ChatGPT、Sora,今天主要推荐一些AIGC的免费工具及网站。

前言

其实早在20世纪50年代就提出了人工智能(AI)一词,确切日期为1956年。但真正引爆点不得不说的是OpenAI发布的首个生成式对话大模型ChatGPT之后。ChatGPT能够完成脚本、论文、文案、邮件的撰写,翻译工作以及生成代码等任务。显然,它在许多方面明显优于传统的搜索业务。目前,该模型已经升级至GPT-4。随后,国内也涌现出类似的对话大模型,如百度的文心一言、阿里巴巴的通义千问、科大讯飞的讯飞星火、腾讯的混元大模型以及华为的盘古大模型等等,但已跟ChaGPT拉开较大距离。尤其是今年2月年后,OpenAI发布了具有划时代意义的AI产品,文生视频工具——Sora,用华为的广告词名副其实真可谓“遥遥领先”。

2024年我推荐的大语言模型除了ChatGPT,还有谷歌最近终于发力的Gemini。

Gemini

Gemini是Google Deepmind最新、最强大的AI模型。 它原生支持多模态,具备跨模态推理能力,包括文本,图像,视频,音频和代码。它包含了 3 个不同版本:Ultra、Pro 和 Nano,分别对应不同的使用场景和需求。Gemini Ultra 可以理解为 Gemini 的完全体,在稍前的测试中,通用、推理、数学、编码等能力的多个基准测试中,Gemini Ultra 都略优于 GPT-4。但在奥秘实际使用测试中,无论是Gemini或是微软的Copilot,都和GPT4稍有差距。

图片[1]-2024人工智能AIGC工具使用推荐-OMii

使用与美友好的国家IP可以直接登录使用。

项目地址:https://gemini.google.com/

ChatGPT

ChatGPT4月2日进一步降低了使用门槛,其3.5模型现在支持免登录永久免费使用。只需有个干净的IP即可。当然如果你有服务器,也可以使用API自己搭建个服务端。推荐下面文章里的几个开源项目。

项目地址:https://chat.openai.com/

白嫖ChatGPT- 4.0教程

前往字节跳动旗下海外代码平台Coze网站通过手机或邮箱注册账号并登录。

注册地址:https://www.coze.com/

按步骤创建机器人,可以翻译成中文进行操作。

图片[2]-2024人工智能AIGC工具使用推荐-OMii

选择GPT模型

图片[3]-2024人工智能AIGC工具使用推荐-OMii

根据自己的需求添加功能插件,数据分析,图片识别,文生图片,文生视频……等等众多功能。

图片[4]-2024人工智能AIGC工具使用推荐-OMii

根据你选择的插件,实现各种功能。示例使用界面

图片[5]-2024人工智能AIGC工具使用推荐-OMii

Suno——文生音乐

Suno AI是一款生成式音频AI工具,它由音乐和人工智能领域的专家开发,可以根据用户的文本生成音乐。它使用了最新的深度学习和自然语言处理技术,可以从用户输入的歌词中理解用户的意思,并生成一首以用户指定的曲风和音乐特性为基础的原创歌曲。

图片[6]-2024人工智能AIGC工具使用推荐-OMii

当然也可以自定义歌词、曲风、歌名,前奏、主歌、副歌、和声等等。

图片[7]-2024人工智能AIGC工具使用推荐-OMii

项目地址:https://suno.com/

Tenso——文生图

谈起文生图,你或许知道Midjourney、DALL-E3、SDXL Turbo、或是Leonardo,但今天推荐的这款工具却有其他AI所不具备的独有优势。从何说起呢,此款工具免费,每天登录即可获取免费算力,足够你折腾的。最重要的有很多喜欢艺术学习的朋友,可以用它来生成各类学习材料。选的模型越真实,生成的学习材料也越真实。

图片[8]-2024人工智能AIGC工具使用推荐-OMii

更多艺术示例图不适宜展示,自己发掘吧。

项目地址:https://tensor.art/

填入邀请码获取额外算力:

Sora——文生视频

2024年2月,OpenAI 发布首个文生视频模型,它能够根据文本指令创建长达60秒的视频,这些视频不仅逼真,而且包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。 他就是Sora,它不仅能够理解用户在提示中所要求的内容,还理解这些内容在物理世界中的存在方式。

图片[9]-2024人工智能AIGC工具使用推荐-OMii

Sora到底强不强,去他的官网看一看你一定能找到答案。尽管Sora还没有开放公测,但不可否认它已经震惊了世界。

项目地址:https://openai.com/sora

说明:早些时候“中国AI第一人”通过制造和放大公众焦虑,收割民众相信给很多朋友带来了困扰。本帖将持续更新,勉强算科普吧。

GPT-4o

就在昨天OpenAIOpenAI 发布了最新旗舰大模型 GPT-4o,限时免费使用,功能涵盖听觉、视觉和语音,体验丝滑流畅毫无延迟,仿佛在进行一次视频通话。

直播回放:https://www.youtube.com/embed/DQacCB9tDaw?si=dFaQXog3ierHF4zt

直播效果更是惊艳:它能感知你的呼吸节奏,并用更加丰富的语气实时回应,甚至可以在适当时打断对话。

GPT-4o 中的 “o” 代表 Omni,即 “全能”,能够接受文本、音频和图像的任意组合输入,并生成相应的输出。

响应速度快至 232 毫秒,平均 320 毫秒,与人类对话反应速度一致。

这是一次馈赠所有人的大礼,GPTo 与 ChatGPT Plus 会员版的所有功能,包括视觉、联网、记忆、执行代码、GPT Store 等,都将免费开放!

(新语音模式将在几周内优先向 Plus 用户开放)

在直播现场,CTO Murati 谦虚地表示:这是将 GPT-4 级别的模型开放给大家。

研究员 William Fedus 揭秘,GPT-4o 是之前在大模型竞技场进行 A/B 测试的模型之一,名为 im-also-a-good-gpt2-chatbot。

无论是用户体验还是竞技场排名,GPT-4o 都超过了 GPT-4-Turbo 级别模型,ELO 分数遥遥领先。

本页内容已结束·点赞收藏不迷路
© 版权声明
THE END
谢各位老爷们打赏。
点赞13打赏分享
评论 共10条

请登录后发表评论