Hva er forholdet mellom kunstig intelligens, maskinlæring og dyp læring?

Kunstig intelligens er et bredt forskningsfelt; maskinlæring er en delmengde av AI, mens dyp læring er en delmengde av maskinlæring.

Hva er de to hovedtypene maskinlæringsmodeller?

De to hovedtypene er veiledet læring, som bruker merket data, og ikke-veiledet læring, som bruker umerket data.

Hva er forskjellen mellom diskriminerende modeller og generative AI-modeller?

Diskriminerende modeller klassifiserer data ved å lære relasjoner mellom etiketter, mens generative modeller genererer ny data basert på lærte mønstre i data.

Hvordan fungerer dype læringsmodeller?

Dype læringsmodeller bruker kunstige nevrale nettverk med flere lag av noder og nevroner for å lære komplekse mønstre i data.

Hva er store språkmodeller (LLMs)?

LLMer er dyp læring-modeller som er forhåndstrent med store data og finjustert for spesifikke applikasjoner for å løse sektorspesifikke utfordringer.

Hvordan kan generative AI-modeller identifiseres?

Generativ AI genererer nytt innhold (f.eks. tekst, bilder, lyd), mens ikke-generativ AI gir ut numeriske verdier eller klassifiseringer.

Hva er noen eksempler på generative AI-modeller?

Eksempler inkluderer tekst-til-bilde modeller som Midjourney og DALL·E, samt tekst-til-video og tekst-til-3D modeller.

Hva er halvveiledet læring?

Halvveiledet læring bruker en liten del merket data og en stor del umerket data for å trene modeller, som i banksvindeldeteksjon.

Hvordan finjusteres store språkmodeller (LLMs)?

De blir spesifikt trent med mindre sektordatasett for ekspertise innen spesifikke bransjer, som i sykehus for å forbedre diagnostisk nøyaktighet.

Google’s AI Course for Beginners (in 10 minutes)!

00:09:17

https://www.youtube.com/watch?v=Yq0QkCxoTHM

摘要

TLDRVideoen komprimerer et 4-timers Google AI-kurs til 10 minutter, og dekker grunnleggende AI-kunnskap for de som ikke har en teknisk bakgrunn. Den forklarer kunstig intelligens (AI) som et bredt felt, hvor maskinlæring (ML) og dyp læring er underfelt. Dyp læring modeller brukes i populære AI-verktøy som ChatGPT og Google Bard, og inkluderer store språkmodeller (LLMs) som trenes og finjusteres for spesifikke oppgaver. Videoen deler også inn ML-modeller i veiledet og ikke-veiledet læring, samt hvordan forstå generative AI-modeller som skaper nytt innhold. Den kommer også inn på hvordan forskjellige generative AI-modeller, som tekst-til-bilde eller tekst-til-video modeller, fungerer. Til slutt inkluderer videoen en oppfordring til en gratis Google-kurs ressurs og tips for AI-bruk.

心得

🤖 AI er et bredt forskningsfelt med maskinlæring som undersegment.
🔍 Maskinlæring bruker data til å trene modeller for prediksjoner.
📊 Veiledet læring bruker merket data, ikke-veiledet bruker umerket.
🌐 Dyp læring benytter kunstige nevrale nettverk.
⚖️ Diskriminerende modeller klassifiserer data, generative modeller skaper nytt innhold.
🗣️ Store språkmodeller er dyp læringsmodeller finjustert for spesifikke bransjer.
💡 Generativ AI genererer tekst, bilder, og lyd.
📸 Eksempler på generativ AI inkluderer Midjourney for bilder og DALL·E.
📈 Halvveiledet læring kombinerer merket og umerket data.
📝 Videoen oppfordrer til å ta det gratis Google AI-kurset.

时间轴

00:00:00 - 00:09:17
Videoen gir en komprimert oversikt over et 4-timers AI-grunnkurs fra Google i en 10-minutters video. Til tross for forventninger om et overfladisk kurs, viser det seg å gi verdifulle begreper for bruk av verktøy som ChatGPT og Google Bard. Videoen forklarer grunnleggende AI-konsepter, starter med AI som fagfelt og maskinlæring som en underkategori. Dyp læring forklares som en videre underkategori som omfatter diskriminerende og generative modeller, inkludert store språkmodeller (LLMs). Videre går videoen inn på forskjellen mellom overvåket og ikke-overvåket læring, og gir eksempler som illustrerer hvordan modeller kan trenes og brukes i praktiske scenarier.

思维导图

视频问答

Hva er forholdet mellom kunstig intelligens, maskinlæring og dyp læring?
Kunstig intelligens er et bredt forskningsfelt; maskinlæring er en delmengde av AI, mens dyp læring er en delmengde av maskinlæring.
Hva er de to hovedtypene maskinlæringsmodeller?
De to hovedtypene er veiledet læring, som bruker merket data, og ikke-veiledet læring, som bruker umerket data.
Hva er forskjellen mellom diskriminerende modeller og generative AI-modeller?
Diskriminerende modeller klassifiserer data ved å lære relasjoner mellom etiketter, mens generative modeller genererer ny data basert på lærte mønstre i data.
Hvordan fungerer dype læringsmodeller?
Dype læringsmodeller bruker kunstige nevrale nettverk med flere lag av noder og nevroner for å lære komplekse mønstre i data.
Hva er store språkmodeller (LLMs)?
LLMer er dyp læring-modeller som er forhåndstrent med store data og finjustert for spesifikke applikasjoner for å løse sektorspesifikke utfordringer.
Hvordan kan generative AI-modeller identifiseres?
Generativ AI genererer nytt innhold (f.eks. tekst, bilder, lyd), mens ikke-generativ AI gir ut numeriske verdier eller klassifiseringer.
Hva er noen eksempler på generative AI-modeller?
Eksempler inkluderer tekst-til-bilde modeller som Midjourney og DALL·E, samt tekst-til-video og tekst-til-3D modeller.
Hva er halvveiledet læring?
Halvveiledet læring bruker en liten del merket data og en stor del umerket data for å trene modeller, som i banksvindeldeteksjon.
Hvordan finjusteres store språkmodeller (LLMs)?
De blir spesifikt trent med mindre sektordatasett for ekspertise innen spesifikke bransjer, som i sykehus for å forbedre diagnostisk nøyaktighet.

查看更多视频摘要

即时访问由人工智能支持的免费 YouTube 视频摘要！

字幕

zh-Hans

自动滚动:

00:00:00
如果你不是搞技术的，
00:00:01
但还是想学一点基础的
00:00:03
人工智能知识，那你就得好好看这个视频，
00:00:05
因为我把Google的一个4小时长的AI扫盲课程内容
00:00:06
都浓缩到了这10分钟的视频中。
00:00:09
其实我一开始并不对这个课程抱多大期待，
00:00:11
因为我觉得它
00:00:13
主要是讲概念上的东西，
00:00:15
而我们这个频道可不讲虚的。
00:00:16
以我对Google的了解，
00:00:18
这个课很可能会在1小时后被下架。
00:00:20
而且我竟然发现，这课所教的底层的概念性知识，
00:00:22
让我能够更好地运用像ChatGPT和Google Bard这样的工具，
00:00:25
还帮我清除了
00:00:27
我没有意识到的有关AI机器学习
00:00:30
以及大语言模型的一系列错误的认识。
00:00:32
那我们从最宽泛的问题说起，
00:00:35
什么是人工智能？
00:00:37
我只能很尴尬地承认，
00:00:39
我才发现之前也并不知道答案。
00:00:41
人工智能像物理学一样，是一整个研究领域。
00:00:43
而机器学习是
00:00:45
人工智能下的一个子领域，
00:00:48
这就好比热力学是物理学下的一个子领域一样。
00:00:51
再往下走一层，就是深度学习，
00:00:53
它是机器学习的子领域，
00:00:55
而深度学习模型
00:00:57
还能进一步分成判别模型，
00:00:58
生成式模型，
00:01:01
以及大语言模型，即LLMs。
00:01:04
而在我们都熟悉的ChatGPT和Google Bard
00:01:06
这样的应用背后的技术，
00:01:08
同样属于深度学习下，
00:01:11
且在LLM和生成式AI的重叠处。
00:01:13
各位可以留言告诉我
00:01:15
你之前知道这个吗？
00:01:17
既然我们现在已经对整个领域
00:01:19
有了初步的了解，也知道
00:01:21
不同的学科之间的关系，
00:01:22
我们现在就来看一下
00:01:25
各个学科层级的一些关键要点。
00:01:27
总的来说，机器学习是一个
00:01:29
利用输入数据来训练模型的程序。
00:01:32
训练后的模型，能进一步
00:01:35
基于全新的数据做出预测。
00:01:38
比如，如果你用耐克销售数据
00:01:40
来训练一个模型，
00:01:42
之后这个模型就能够
00:01:44
在阿迪达斯销售数据的基础上
00:01:47
去预测阿迪新鞋的销售表现。
00:01:49
机器学习模型的两种最常见的类型
00:01:51
分别是监督学习，和无监督学习。
00:01:54
这两者之间最关键的区别在于，
00:01:56
监督学习使用的是有标记的数据，
00:01:58
而无监督学习使用未标记的数据。
00:02:01
在这个监督学习的例子中，
00:02:04
这个散点图展示了
00:02:05
一个餐厅的单个账单总额和
00:02:07
小费金额之间的关系。
00:02:10
而且这些数据是有标记的。
00:02:13
蓝点等于顾客自取订单，
00:02:15
黄点等于商家派送订单。
00:02:17
这样使用监督学习模型，
00:02:19
我们下次就能根据账单总额和
00:02:21
是否自取或派送订单，来预测
00:02:24
我们能收到多少小费。
00:02:26
对于无监督学习，我们会去看
00:02:28
原始数据是否能够自动形成分组。
00:02:30
比如，这个图展示了
00:02:33
一个企业中员工任职年数
00:02:35
和其薪资收入之间的关系。
00:02:37
我们会看到，这一组员工的薪资/年数比例
00:02:39
比下面这组更高。
00:02:42
我们还知道，这些数据都未经标记。
00:02:44
如果这些数据有标记，
00:02:47
那我们会看到性别，工作年数，
00:02:50
所属部门，等等。我们现在就可以让这个
00:02:53
无监督学习模型来解决这样的问题，
00:02:54
比如这个新入职的员工
00:02:57
是否在高速成长？
00:02:59
如果他们在左边这组，答案就是肯定的。
00:03:01
如果在右边，则否。
00:03:04
专业技巧，这两个模型之间还有一个显著差异。
00:03:05
监督学习模型在
00:03:07
做出预测之后，
00:03:09
它会将预测结果
00:03:11
与用于训练模型的数据进行比较。
00:03:13
如果两者间存在差异，
00:03:16
它会尝试去缩小这个差异，
00:03:18
而无监督学习模型就不会这样。
00:03:20
对了，这个视频没有赞助，
00:03:22
但你们可以通过付费订阅我的
00:03:23
谷歌软件技巧文章来支持我。
00:03:25
可以到我的网站jeffsu.org/productivity-ping
00:03:27
了解更多详情。
00:03:29
对机器学习有了基本了解之后，
00:03:31
我们就可以开始了解深度学习了。
00:03:33
深度学习其实就是机器学习的其中一种，
00:03:35
它利用人工神经网络来进行学习。
00:03:37
别担心，你只需要知道
00:03:40
人工神经网络是
00:03:41
以人类大脑为灵感源泉的，
00:03:43
它大概就长这样，
00:03:46
一层层的节点和神经元。
00:03:49
节点和神经元越多，
00:03:51
模型就越强大。
00:03:53
由于这些神经网络的存在，
00:03:54
我们就可以进行半监督学习，
00:03:57
就是用一小部分标记数据
00:03:59
和一大部分未标记数据
00:04:02
来训练深度学习模型。
00:04:04
比如，一个银行会用深度学习模型来检测诈骗行为。
00:04:06
这个银行会花一点时间来
00:04:08
把5%的交易数据贴上
00:04:11
诈骗和非诈骗交易的标签。
00:04:14
由于银行没有足够多的时间和资源
00:04:16
去把所有的数据都打上标记，
00:04:17
剩下的95%的交易数据都是无标记的数据。
00:04:19
这个模型的秘诀在于
00:04:22
它利用这5%的标记数据
00:04:23
去学习一个任务涉及的基本概念，
00:04:26
这些是好的，
00:04:28
那些是坏的，好了。
00:04:31
这个模型会把前面学到的知识应用到
00:04:32
剩余95%的未标记数据上，
00:04:36
利用这整个新的数据集，
00:04:38
对未来的交易来做出预测。
00:04:41
这很酷，不过还没结束呢。
00:04:43
深度学习有两种模型，
00:04:44
即判别模型和生成式模型。
00:04:46
判别模型学习
00:04:49
数据的标记之间的关系，
00:04:51
而且它只能够给
00:04:54
这些数据点进行归类，
00:04:57
例如欺诈还是非欺诈。
00:04:59
比如现在你有一堆图片，或数据点。
00:05:01
你现在给他们打上
00:05:04
狗或者猫的标记。
00:05:06
判别模型会学习猫或狗的标签，
00:05:08
如果你提交了一张
00:05:10
狗狗的图，它就会
00:05:13
预判这个数据点的标记：一只狗。
00:05:15
现在我们终于说到生成式AI了。
00:05:18
和判别模型不同的是，
00:05:20
生成式AI模型学习的是数据的规律，
00:05:22
它在接收到一些输入之后，
00:05:24
比如我们给它一段文本指令，
00:05:26
他们会根据刚学到的数据规律，
00:05:28
来生成新的内容。再以刚才的动物来举例，
00:05:31
这些图片或者数据点
00:05:33
并没有被标记为猫或者狗，
00:05:36
生成式模型会去寻找规律，
00:05:37
噢这些数据都含有
00:05:40
两只耳朵，四条腿，一条尾巴，爱吃狗粮，
00:05:43
还会犬吠。当你让它生成
00:05:45
一个叫做狗的东西时，
00:05:48
生成式模型会根据之前学到的规律
00:05:51
生成一个全新的图片。
00:05:53
有一个简单的方法能让我们轻松辨别出
00:05:55
某个模型是否是生成式AI。
00:05:57
如果输出结果是数字，类别（比如垃圾或非垃圾信息），
00:06:00
或者概率，它都不是生成式AI。
00:06:04
只有当它生成自然语言
00:06:06
（文本或语音），图片，或声音时，
00:06:09
它才是生成式AI。
00:06:12
生成式AI生成全新的样本，
00:06:15
类似于用来训练它的那些数据。
00:06:18
接下来说说不同类型的生成式AI模型。
00:06:20
我们大多数人都熟悉
00:06:22
ChatGPT或Google Bard这样的文本转换模型，
00:06:25
其他常见的模型类别还包括
00:06:27
文本到图像模型，比如Midjourney，
00:06:29
DALL·E，以及stable diffusion。
00:06:32
它们不仅能生成图片，还能编辑图片。
00:06:35
文本到视频模型，
00:06:37
诶嘿想不到吧，
00:06:40
它们能生成和编辑视频。
00:06:42
比如imagen video，CogVideo还有这个
00:06:44
名字非常有创意的make a video。
00:06:47
文本到3D模型可用来创作游戏素材，
00:06:49
一个不太知名的例子是OpenAI的shap-e模型。
00:06:51
最后，文本到任务模型
00:06:54
是被训练来专门完成某个具体任务的。
00:06:56
比如，当你输入
00:06:59
@Gmail请你概括我的未读邮件，
00:07:02
Bard会通读你的收件箱，
00:07:04
然后概括出你未读邮件的内容。
00:07:06
接下来说说大语言模型。
00:07:08
别忘了LLMs也是深度学习的一个子集，
00:07:10
尽管两者有一些重叠，
00:07:13
LLMs和生成式模型并不是同一回事。
00:07:17
它们俩有一个重要的区别，
00:07:19
即大语言模型通常是
00:07:21
先用大量数据进行预训练，
00:07:23
再根据具体的目的进行精细的微调。
00:07:26
这是啥意思？
00:07:28
假设你有一只宠物狗，你可以提前训练它学会
00:07:30
一些基础的指令，比如坐下，过来，趴下，
00:07:33
还有待着别动。学会了之后，
00:07:35
它就是一只乖狗狗，还是个通才。
00:07:37
但如果这只乖狗狗要变成一只警犬，
00:07:39
导盲犬，或者狩猎犬，它就要接受
00:07:42
更具体的训练，从而被微调成为
00:07:45
那个特别的专家狗狗。
00:07:48
大语言模型也是同理。
00:07:51
它们先被训练出一些基本语言处理技能，
00:07:53
比如说分类文本，
00:07:55
回答问题，
00:07:57
概括文档，以及生成文本，
00:07:59
然后再用更小一点的行业数据集
00:08:02
把这些大语言模型微调成行业专家
00:08:05
去解决具体的行业问题，
00:08:07
例如零售、金融、医疗和文娱等领域。
00:08:11
在真实世界中，这可能意味着
00:08:13
一些大型科技公司
00:08:16
预训练过的大语言模型，
00:08:18
被医院用自己一手的
00:08:20
医疗数据来进行微调，
00:08:23
从而提升X光或其他检测的
00:08:25
诊断正确性。
00:08:28
这是一个双赢的局面，
00:08:30
因为大型公司花费
00:08:32
数十亿美元来打造一个通用模型，
00:08:34
或者是大语言模型，然后再将这些模型
00:08:36
卖给那些更小型的机构，
00:08:39
比如零售、银行、医院等。
00:08:41
他们虽有专业的行业数据可用于微调模型，
00:08:44
却没有足够的资源来
00:08:46
打造自己的大语言模型。
00:08:49
专业技巧，如果你想学习这个免费课程，你可以去
00:08:50
cloudskillsboost.google/course_templates/536。
00:08:52
如果你想做笔记，可以在视频上点击右键，
00:08:54
复制当前时间的视频网址，
00:08:56
你就能够快速
00:08:58
找回到那个视频片段。
00:09:00
这个课程一共有5个模块，
00:09:02
你每完成一个模块，
00:09:04
就会获得一个小奖章，
00:09:07
由于这个课程确实是比较理论化的，
00:09:08
所以你一定要去看看我的
00:09:10
关于如何掌握AI提示语技能的视频。
00:09:12
我们下期视频再见，同时，
00:09:14
祝你拥有美好的一天！

标签

AI
Maskinlæring
Dyp læring
Store språkmodeller
Generativ AI
Veiledet læring
Ikke-veiledet læring
Halvveiledet læring