笔趣阁

手机浏览器扫描二维码访问

338 无标签图像时代 合(第1页)

卡雷鲁有关自己的书籍大卖,孟繁岐时隔快两年再次与他通话了一番。

一方面向他表示祝贺,即便是卡雷鲁这样的金牌记者,文字功底深厚,可想要写出这种级别的全民畅销书,也并非容易的事情。

另一方面,孟繁岐也向他表示了一下自己的感谢之情。

虽然孟繁岐个人其实稍微有些吃不消卡雷鲁在书中的赞美,那些运用艺术手法写作手法的桥段看得他是面红耳赤。

不过对于人家的这番心意,孟繁岐觉得自己还是需要表示感谢的。

“这本小说现在叫好又叫座,销量趋势更是一路走高。我看啊,原本没谈好的什么电影电视剧,现在都没什么问题了,这帮人肯定要回头来找我。”卡雷鲁显然还是对此前被连续放鸽子的事情耿耿于怀:“以前他们把我呼来喝去的,现在想要我的版权和改变授权,可就不是那么容易的事情了!”

卡雷鲁洋洋得意地说到这里,似乎突然想起了什么,问道:“对了,就是不知道你现在还有没有时间出镜扮演你自己。”

孟繁岐此前是答应了这件事没错,可时间隔得实在太久了。

当时的承诺,如今效力就比较弱了。

“我自己出镜的话还是算了吧,我本身就不是专业的,没有这方面的技能。当初在谷歌给别人打工,跑去拍摄一下倒也过得去。现在自己当老板了,时间确实有些紧张。”时过境迁,孟繁岐也成长了许多。

那时候比较爽快地答应,也是有些爱出风头,想要世人关注自己的成分在。

后来经历世纪大战等多次曝光,孟繁岐在这方面的兴趣早已消退,这些事情实在也没什么意思。

卡雷鲁对此似乎有所预料,也不勉强。

他请求孟繁岐到时候把关一下剧本内有关自己的内容,又或者参与挑选一下扮演自己的演员。

对这些事情,孟繁岐还是有些兴趣的,便爽快地答应下来。

此番插曲之后,孟繁岐几乎马不停蹄地就又投入到了多模态相关的技术上面。

虽然进展比较顺利,但chatgpT仍旧未到盈利的阶段,制图aI也还在开。

这两个主要进项还未完工,孟繁岐每天都仍在烧钱,不由得他不急。

几周过后,在c1oseaI内部的研讨会上,实验小组向孟繁岐汇报了第一轮的实验结果。

有关对齐文本和图像的c1ip方法实验,c1oseaI取得了非常显著的成果,但是其中也存在非常严重的短板。

“老板,目前呢,通过文字和图像的特征对齐,优化它们之间的余弦相似度,我们观察到了非常明显的效果。”汇报结果的大基调是好的,孟繁岐指出的这個大方向看上去非常正确。

“不过呢。。。在实验过程当中,我们现从图像到文本这方面的成果比较顺利。相反的方向,如果想要从文本直接生成图像,效果就有些不尽人意了。”这一点是目前困扰了c1oseaI研究组的最主要难题。

其实在孟繁岐的意料之中,不过对实验人员来说是比较突然的。

“按理来说呢,图像和文字之间建立联系之后,这应该是一个双向的关联。没道理一条路走得通,反过来就走不了了。就比如翻译任务,如果两种语言之间的关联被建立了,就很容易做到相互指定。”

孟繁岐能够理解大家的困惑,就拿他们刚才举的例子来说,中文的【狗】与英文的【dog】被学到了关联之后,两者之间就能够互译。

不会存在中译英成功,但英译中就做不了的情况。

可图像和文字之间的关联,则并非如此简单的事情。

“文字的表达是高度抽象的,往往是一对多的。有非常多形态各异的图像可以对应几乎相同的文字,因而,将一张图片总结成文字是比较容易的事情,反过来的难度则会大大提升。”孟繁岐说的第一点其实还不是最关键的。

他接下来提到的这件事,很多人其实都没有仔细思考过:“其实图像对比语言,最大的不同在于它其实是高度稀疏的一种内容。语言的信息密度非常之高,它是人类明总结的产物。而图像,是一种非常本质基础的感知,对于一副图片来说,很可能其中的大部分内容都是对任务来说无意义又或者无效的。”

孟繁岐说完这点之后,c1oseaI众人的思路瞬间打开了不少。

“我想起来了,T方法的核心,注意力机制,其实一大关键就是在于让模型关注图像中重要的部位,忽略不重要的区域。这对于传统的分类任务是好事,但对于图像生成来说,则未必!”韩辞的反应是最快的。

传统的图像任务,分类、检测、分割,要点就是让模型找到图片中关键物体的类别、位置和轮廓。

一切的一切都是为了让aI模型去看图片中的关键点,所谓的注意力也是指模型对图片的关注情况。

在这样的总体思路下,模型对于图片的理解和分析是有偏向的。

它们擅长做分析任务,却很难做生成任务。

如果想要处理好图像的生成问题,必须针对生成做专门的训练。

一说到这个,大家的第一反应就是gan,对抗生成办法。

“但是gan的训练量太大了。。。”只是稍微一想,大家就很快否掉了这个思路。

gan本身的训练量和时间就不短,以前小模型时代还能玩一玩,现在这个规模,即便是孟繁岐也负担不起。

加上视觉T方法本身就吃数据量,两者叠加起来,岂不是要了人命了?

“其实处理视觉T方法的生成能力,未必就需要真的去从零做生成。”孟繁岐一听大家的语气就知道他们在想什么:“我其实有一个方法能够绕开gan繁琐的地方,直接利用海量图片,甚至连一点标签都不需要。”

“直接利用无标签的图片???”众人直接被这个大胆的想法惊呆了。

图片分类需要标注图像的类别,检测需要用选框标注物体的位置,分割需要画出目标的轮廓,文字加图像应需要标注对应关系。

图像数据需要标注才能够使用。

一直以来都是如此。

数据越多,标注质量越高,模型的能力也会因此大幅度提升。

过去的两年时间,几乎每一件事情都在佐证大家的这种想法。

热门小说推荐
在影视世界里降妖除魔

在影视世界里降妖除魔

相亲女你什么工作啊秦横降妖除魔,你可以叫我捉妖师,也可以叫我降魔者,怪物猎人也可以。相亲女这世上没有妖魔鬼怪啊。秦横是啊,被我祖上杀完了,不然你觉得为什么没有相亲女所以,你是有...

明末最强族长

明末最强族长

作品简介族长当得好,族人没烦恼,明末在风雨中飘零的华夏民族,更需要一个强有力的大族长!...

挑战主播会一点入狱技能怎么了?

挑战主播会一点入狱技能怎么了?

简介关于挑战主播会一点入狱技能怎么了?林风获得挑战系统,只要不断挑战,就能够获得丰厚的奖励。带着玩具枪去银行取钱遇到了真劫匪?直播画美元并用出去?大声念出陌生人手机上的内容,结果抓住了一个犯人?管理公交车秩序,制服了抢夺方向盘的大妈?观众1主播,你怎么又进橘子了?观众2主播,你是住在橘子吧?观众3主播,你真刑。观众4主播,你把橘子当自己家了吧?林风我一个挑战主播,会一点入狱技能怎么了?...

明朝好丈夫

明朝好丈夫

有知识有文化会治病会杀人。很热血很邪恶,很强大,很牛叉。我是锦衣卫,我是赘婿,我是天子亲军,我是太子教父。我就是我,一个好丈夫,一个好权臣,正德一朝,因我而多姿,因我而精彩。小说关键词明朝好丈夫无弹窗明朝好丈夫txt全集下载明朝好丈夫最新章节阅读...

绝顶神医

绝顶神医

实习小医生林凯无意间继承了医叟道人的传承,各种医术,相术,符咒术,甚至还有修炼功法。从此,医院同事另眼相待,美女护士芳心暗许,医学女博士半夜来请教,甚至,娇弱的女病人追着要认他干哥哥。林凯誓要将老祖...

大佬的小心肝又凶又野

大佬的小心肝又凶又野

商界大佬6执野出了名的冷傲矜贵,不近女色,突然有人现,6执野的锁骨上多了一道咬痕,当天,整个帝都都沸腾了她是被豪门抱错的假千金,被未婚夫和闺蜜联合背叛,所有人都想来踩她一脚,可她转身嫁给了6家九...