过去几年,人工智能“聊天机器人”的爆炸式增长,以及它们生成模拟人类写作的文本的能力,往往非常准确,这让人们把注意力集中在了文本的结构上。
分析文本的一种有用方法是将其视为一个网络,数学家和计算机科学家所熟悉的网络分析方法在语言学中也很强大。
网络理论可以用不同的方式来模拟文本块中单词之间的关系,将分析模式与连贯性和写作质量的一些更主观的方面联系起来。
来自巴西巴伊亚州立大学的Davi Alves Oliveira和Hernane Borges de Barros Pereira比较了五种将句子表示为网络的方法,表明每种方法都有特定的应用价值。这项分析现已发表在《欧洲物理杂志B》上。
他们的研究重点是文本的一种被称为衔接的特性,它本质上是使文本块作为一个整体而不是随机句子的集合。它的衔接很大程度上是由单词之间的关系建立起来的。“把文本想象成地图,把文字想象成城市……我们根据单词之间的关系来连接单词,”奥利维拉解释道。“这让我们可以探索语言使用者如何策略性地选择词汇来构建一个连贯的结构。”
网络理论以节点为基础,节点之间通过边连接,边定义了节点之间的关系。Oliveira和Pereira提出了在文本中定义这些节点和边缘的五种不同方法,然后使用网络分析工具来测量连接的强度和模式。
在一些模型中,单个词被引理或基本词(因此“文本”将代表“文本”和“文本”)和/或连接词(如“和”或“the”)取代为节点;边可以连接连续的单词,或者连接同一句子中的单词。
奥利维拉补充说:“这种分析使我们能够看到词语的选择是如何相互影响的,并对文本的整体意义和结构做出贡献。”
连贯性,以及写作质量的更主观的方面,如清晰和流畅,都可以与网络模式联系起来。这表明,研究人员的分析可能对语言教师、作家和翻译具有实际应用价值。
更多信息:Davi Alves Oliveira等人,用网络建模文本:比较句子表示的五种方法,欧洲物理杂志B(2024)。DOI: 10.1140/epjb/s10051-024-00717-0期刊信息:European Physical Journal B由SciencePOD提供引文:Five ways to model text using networks (2024, August 5)检索自https://techxplore.com/news/2024-08-ways-text-networks.html本文受版权保护。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。
点击分享到









