更多科技趣闻,欢迎点击右上角关注我~

大概,你没有刷过抖音,但你有 90% 的概率听过这抖音神曲 ——

我从这些歌词里看到了人类复读机的本质 休闲娱乐

我们一起学猫叫,一起喵喵喵喵喵 ”( 接下来的一小时,这段旋律可能会一贯在你脑海回荡 )

这首《 学猫叫 》歌曲时长 3 分 29 秒,从头到尾歌词统共 486 个字,个中 “ 一起 ” 涌现了 15 次, “ 猫 ” 字涌现了 16 次,“ 喵 ” 字利用频率最高,涌现了 67 次。


如果我们把整首歌里重复的字眼去掉( 只保存首次涌现的字 ),差友们猜猜整首歌还剩多少内容?

答案是 101 字。


也便是说,这首 3 分多钟的词句创作实在只用到了 100 多个汉字,是不是瞬间有一种作词很随意马虎的错觉?

这种不断重复用词用句的表现方法,在现在的盛行音乐创作中彷佛变得越来越常见了,乃至形成了一种分外风格。

我们越来越喜好听歌词重复的歌曲,这会不会跟当代人日益低落的影象能力有关呢?

好巧不巧,美国的打算机科学家唐纳德在 1977 年揭橥了一篇文论《 歌曲的繁芜性 》,好好的调侃了一番这个音乐界的天下级征象 —— 盛行歌曲的歌词内容重复度越来越高了( 也便是说,他认为每首歌用到的词汇量越来越少 )。


事情真的是这样的吗?

想要证明这个论点,小辣椒开头用的方法当然不足严谨,而美国一个学者科林 · 莫里斯用 “ 无损数据压缩 ” 的算法,帮唐纳德用大数据论证了一下他的不雅观点。

科林以 1958 年到 2017 年里上过 Billboard 榜单的 15000 首歌作为数据样本,进行了算法剖析。

举个例子,洗牙姐( 歌手 Sia )的 Cheap Thrills,整首歌重复循环的段落有很多。

我们把个中重复,看上去没有什么意义的部分全部压缩删除,247 个字节末了只剩下了 133 个,有 46.2% 的词语都是可以被去掉的。


压缩过程示意图

差友们可能也不雅观察到了,有些词语的字母( 比如上面一段中的,thrills,由于 ills 和 bills 重复也被直接压缩了 )也被直接删除了,这是算法的一套删除规则,并不影响末了的统计结果。

不同段落之间的可压缩性也会由于段落的重复度而有所不同。

像是这一段,只有一些词汇而不是整句重复,以是被压缩率就比上一段要低很多。

压缩过程示意图

经由算法一番猛如虎的操作,你猜洗牙姐这首歌的可压缩率有多高?

76% 。


emmmmm,歌曲里有 76% 的字节都被视为无效信息,可以直接被删除,和更换。

算出结果的科林还皮了一下,自己Cheap Thrills 的歌词给改了,意思不变,但是全部有效,无法被算法抹掉。


左边为原词,右边是科林的创作

在对样本中的 15000 首歌全部都骚操作了一遍之后,科林得出了这样的一个规律,这些歌曲的均匀可压缩性在 50%,也便是至少有一半的歌词重复。


想知道歌词重复率最高的一首是什么歌吗?

是 Daft 在 1997 年创作的电音

整首歌 7 分钟,歌词就只有一句 ——“ Around the world ”。

当然了,你可能会说电音本来就没什么歌词。


这一点科林也想到了,于是他又打消了 20 首最极度的例子,得到的趋势结果险些一样。


而这种歌词重复率的规律跟韶光有关系吗?

还真有。


2010 年后这样的歌曲明显比前几个年代多了不少。


部分数据

这可能跟不同类型的歌曲在不同年代的受欢迎程度有很大关系。

比如,10 年代里越来越多的 Rap 在所有的歌曲类型里,歌词重复率是最低的,想想大型 diss 现场,你 diss 过去 diss 过来都是那几句,没有攻击性啊!

阿姆的作品重复性都比较低

村落曲有时候讲究歌词的故事性,以是会比对节奏感哀求更高的 Hip Hop 歌词重复性更高。

你看,梅梅的村落曲就比她的盛行乐歌词重复率低。


以及 Hip Hop diva 日日,一句 Shine bright like a diamond 重复十几次可以霸榜几周,不知道是高重复强节奏的曲风造就了她的成功,还是她的风格引领了盛行( 好听是真好听啊 )。


实在歌词创作本来就对押韵、节奏有很多哀求,歌词重复性高并不代表歌曲含金量低,音乐这种艺术,讲究的更多的还是可不雅观赏性。

像是之前科林帮洗牙姐改的歌词,重复度是小了,可谱成曲该有的节奏全没了不好听啊。


而时期的偏好反应出来的,更多的是我们对音乐艺术审美的变革,新的曲风出身,受到欢迎,迎领潮流,这很故意思,不是吗?

图片、资料来源:1. https://pudding.cool/2017/05/song-repetition/2. 部分图片来源谷歌

“ 果真,人类的实质便是复读机 ”