Четверг, 23.11.2017, 10:35
Высшее образование
Приветствую Вас Гость | RSS
Поиск по сайту



Главная » Статьи » Филология и перевод

ИССЛЕДОВАНИЕ ТЕКСТА НА ПРЕДМЕТ НАЛИЧИЯ В НЕМ НАМЕРЕННО ИСКАЖЕННОЙ ИНФОРМАЦИИ: ПРОБЛЕМЫ И ПЕРСПЕКТИВЫ

Т.А.Литвинова, О.А.Литвинова

ИССЛЕДОВАНИЕ ТЕКСТА НА ПРЕДМЕТ НАЛИЧИЯ В НЕМ НАМЕРЕННО ИСКАЖЕННОЙ ИНФОРМАЦИИ: ПРОБЛЕМЫ И ПЕРСПЕКТИВЫ

АННОТАЦИЯ. В настоящее время в мировой науке идет активный поиск объективных методик выявления лжи в речевых произведениях, в том числе и письменных, что обусловлено и нуждами практики: в связи с развитием интернет-коммуникации проблема выявления лжи в тексте приобрела особую актуальность. Показано, что современный подход к выявлению в тексте намеренно искаженной информации, применяющийся преимущественно к английскому языку, связан с использованием статистических методов и методов автоматической обработки языка на материале специально созданного корпуса текстов. Обозначены пути поиска новых маркеров лжи в письменном тексте на русском языке.

КЛЮЧЕВЫЕ СЛОВА: ложь, языковые маркеры лжи, лингвистика лжи, распознавание лжи в речи, математические методы в лингвистике, нейролингвистика, нейробиология лжи, моделирование личности по тексту.

 

Проблема распознавания лжи имеет не только теоретическую, но и практическую значимость. Как показывает обзор научной литературы, способность человека к детекции лжи, основанная на интуиции, лишь немногим превышает случайную величину и даже у профессиональных профайлеров (специалистов по бесконтактной детекции лжи) достигает максимально 64% (см. подробнее: [1]). Поэтому усилия современных ученых и специалистов-практиков в настоящее время направлены на создание специальных методик и разработку специальных технических средств, помогающих распознать ложь в поведении человека или его высказываниях.

В основе подобных разработок (одной из которых является полиграф) лежит выявление невербальных и паравербальных маркеров лжи. Однако современные нейрофизиологические исследования доказывают: невербальные и паравербальные маркеры лжи недостаточно надежны, они свидетельствуют прежде всего о том, что испытуемый находится в состоянии стресса (а это необязательно связано с тем, что человек лжет); эффективность использования подобных маркеров во многом зависит от умения испытуемого справляться с волнением [там же]. Осознание указанных выводов привело к тому, что в современной мировой науке стали активно изучаться не только невербальные, но и вербальные маркеры лжи, и подобные исследования представляются весьма перспективными.

Приоритет в разработке проблем распознавания лжи в речи как в отечественной, так и в мировой науке принадлежит психологам. Среди российских исследователей одним из первых обозначил проблему изучения лжи как явления, имеющего свои законы и принципы, Р. Лурия. Определяя ложь как «мышление, построенное по другому принципу», он считал, что такое мышление «имеет свои формы, свои правила, свои приемы» [2, с. 92], которые должны находить выражение в речевой продукции. Вопросами изучения лжи в речи человека занимался и А.А. Леонтьев, который предложил наиболее корректную, на наш взгляд, трактовку самого понятия ложного речевого высказывания как такого речевого произведения, «в котором действительное положение вещей намеренно передается в искаженном виде» [3, с. 35].

Несмотря на значимость отечественных психологических научных исследований в области определения речевых высказываний, содержащих заведомо ложную информацию, в российской лингвистике названные вопросы только начинают получать свое освещение. Имеются лишь единичные работы, посвященные отдельным аспектам проявления лжи в письменном тексте (см. подробнее: [4]). При этом следует отметить, что подобные исследования, весьма немногочисленные, проводятся преимущественно на материале художественной литературы, а не текстов, созданных в «реальных» условиях. Все изложенное выше позволяет согласиться с мнением А.В. Ленец о том, что изучение лингвистического аспекта лжи как полноправное направление общелингвистической теории лжи в отечественной науке ещё не сформировалось [5], хотя, безусловно, «людям нужна языковедческая помощь в своевременном опознании лжи» [6].

Как показывают проведенные нами исследования, принципиально важным для решения проблем, связанных с разработкой методик детекции лжи в тексте, является положение о том, что выбор способов построения ложного речевого акта в дискурсе в значительной мере определяется психологическими и биолого-физиологическими особенностями говорящего/пишущего, а следовательно, для объективного лингвистического описания лжи необходим учёт тендерных, возрастных, психологических, профессиональных и национально-специфических факторов оформления лжи в речи коммуникантов (подробнее об этой проблеме и ее разработке на материале английского языка см.: [7]). Отметим, что подобного рода исследования в мировой науке единичны, а выводы носят предварительный характер в силу того, что названная проблема только начинает разрабатываться, однако применительно к русскому языку данная проблема находится лишь в стадии ее постановки [там же].

В зарубежной науке с середины 1960-х годов вопросы выявления лжи в речи разрабатываются в рамках специального научного направления - лингвистики лжи, возникшего на стыке практической психологии и судебной практики. Накопленный зарубежными исследователями огромный эмпирический материал позволил создать несколько методик анализа речевой продукции для оценки ее истинности/ложности. Фактической базой для разработки подобных методик служила в основном транскрибированная устная речь. Большинство из них представляют собой техники ведения интервью или предполагают контент-анализ речи (анализ частоты встречаемости слов тех или иных тематических групп и пр.). Однако такие техники анализа речевой продукции, принимаемые в некоторых странах даже в качестве судебного доказательства, оказываются трудоемкими в использовании, во многом субъективными и не всегда основанными на научных фактах. Осознание указанных обстоятельств вызвало необходимость поиска новых, более валидных методик диагностирования лжи в речи.

Для ухода от субъективности предыдущих методов выявления лжи в речи ученые стали искать такие подходы к анализу речевой продукции как устной, так и письменной, которые были бы основаны на изучении не только ее содержательного уровня, но и формально-языкового, и предполагали бы применение объективных статистических методов анализа [8]. То есть научный поиск в решении рассматриваемой проблемы стал ориентироваться на выявление поддающихся вычислению параметров текста, по которым бы могли различаться «ложные» и «правдивые» речевые произведения.

Как показывает изучение научной литературы, зарубежные ученые активно применяют технологии автоматической обработки языка (natural language processing, NLP) и методы математической статистики для анализа языкового материала с целью получения данных о характеристиках «ложных» текстов и создания диагностирующих математических моделей, в которых в качестве переменных выступали бы численные значения параметров текста, а на выходе бы получалась вероятность наличия в языковом материале ложной информации. При этом разрабатываются компьютерные программы, позволяющие автоматизировать процесс анализа текста. Изучение представленных в научной литературе данных позволяет сделать вывод о том, что методики детекции лжи в тексте с применением методов матстатистики и формально-лингвистического анализа в настоящее время считаются весьма перспективными. Они не инвазивны, не требуют сложной подготовки, особенно пригодны для анализа онлайн-коммуникации, их результаты менее субъективны. Для использования подобных методик не требуется сложного оборудования, нужен всего лишь образец текстового материала. Кроме того, продуцент речевого высказывания, подозреваемый во лжи, может не догадываться о том, что подвергается проверке, что также повышает объективность исследования (ср. ложноположительные результаты проверок на полиграфе из-за стресса подозреваемого).

Проведенный нами анализ большого количества литературы (более двухсот англоязычных статей из БД Scopus за 2004-2014 годы), посвященной автоматизированному выявлению лжи в речевой продукции, позволяет констатировать устойчивый интерес научного сообщества к анализу текстов «реального мира» (в основном судебной практики), в том числе к текстам интернет-коммуникации, и в целом практическую направленность исследований: авторы подобных работ ставят задачу не просто описать статистически значимые различия между «ложными» и «правдивыми» текстами по ряду формализуемых параметров (средняя длина слова, средняя длина предложения в словах, число слов тех или иных частей речи, индексы удобочитаемости и пр.), но и на основе найденных корреляций создать модели, оценивающие вероятность наличия в тексте ложной информации.

Основной вопрос, с которым сталкиваются ученые, работающие в рассматриваемом направлении, связан с выбором параметров текста для анализа, и этот вопрос в настоящее время еще далек от своего разрешения. Маркеры, эффективные для одного корпуса текстов, могут не обладать различительной силой для другого типа корпусов. Требования, предъявляемые к параметрам текста в подобных исследованиях, сводятся к следующему: они должны отражать универсальные языковые явления, поддаваться квантификативному изучению на выборках сравнительно небольшого объема, а также - по возможности - автоматическому извлечению средствами NLP [9]. В исследовании [10], проведенном по заказу Министерства обороны США и имеющем в качестве одной из целей выявление языковых маркеров лжи на основе использования вычислительных методов, авторы делают вывод о том, что, несмотря на все сложности, автоматизированное определение лжи в тексте - достижимая цель, но при этом крайне необходимы дополнительные исследования для того, чтобы выявить новые, более эффективные языковые маркеры указанного феномена.

Подводя итог изложенному выше, можно утверждать, что речь как продукт мыслительной деятельности несет информацию об «истинности» или «ложности» (с позиции говорящего/пишущего) той или иной информации, передаваемой в ней, однако валидных методик детекции лжи в речевых высказываниях пока не выработано, полученные данные зачастую противоречивы, хотя идет активный научный поиск языковых маркеров лжи. В первое десятилетие XXI века в зарубежной науке намечается интеграция разработанных ранее подходов к решению проблемы поиска языковых маркеров лжи и предпринимаются попытки использования автоматизированных методов исследования, что связано с развитием возможностей автоматической обработки языка при использовании парсеров и с развитием статистических методов. Однако, как указывают сами авторы подобных исследований, необходимо искать новые, более эффективные языковые маркеры лжи, что, по нашему мнению, невозможно без обращения к данным современной психологии, а также нейронаук - нейролингвистики, нейробиологии и нейропсихологии.

В настоящее время в мировой науке активно идет поиск нейронных маркеров лжи, для чего изучается активность человеческого мозга во время продуцирования лжи, в том числе с использованием метода визуализации работы мозга (neuroimaging). В ходе таких исследований было установлено, что при продуцировании «ложного» и «правдивого» текста задействуются разные зоны мозга. Так, во время продуцирования заведомо «ложного» текста наблюдается повышенная активность в зоне префронтальной коры, которая отвечает за рабочую память, контроль действий и планирование [11]. Изучаются также различия в активации лобных долей при продуцировании «ложных» и «правдивых» текстов [12]. Отметим, что такого рода исследования проводятся в настоящее время и в России. Так, в одной из работ [13] указывается на обнаруженное исследователями вовлечение мозговой системы детекции ошибок в обеспечение процессов сознательной лжи.

Как известно, очень много для понимания механизмов различных явлений дает их изучение у испытуемых с различными патологиями. Подобные исследования оказываются весьма ценными и для решения проблем распознавания лжи в тексте. Так, в работе A. Nobuhito [14], посвященной анализу нейробиологической основы лжи и изучению особенностей ее продуцирования пациентами, страдающими болезнью Паркинсона, отмечается, что такие пациенты не склонны ко лжи, видимо, по той причине, что нейрофизиологические процессы, которые сопровождают болезнь, вызывают когнитивные трудности, препятствующие продуцированию лжи. Видимо, данное явление обусловлено тем, что указанное заболевание связано с поражением префронтальной коры, которая, как известно, ответственна за когнитивные процессы, требующие контроля и гибкости, и активизируется у здоровых испытуемых [15] во время лжи.

В настоящее время практически общепризнанным является связь лжи с повышенной когнитивной нагрузкой (см., например, [1]), что позволяет предположить: при продуцировании ложных высказываний у человека должно наблюдаться снижение языковой сложности речевой продукции. Вместе с тем очевидно, что на этот процесс будут оказывать влияние способности конкретного человека справляться с когнитивной нагрузкой, объем его рабочей памяти и пр. Кроме того, необходимо учитывать и особенности процесса порождения устной и письменной речи, ведь очевидно, что при порождении устной речи говорящий обладает меньшим количеством времени и ему сложнее справиться с повышенной когнитивной нагрузкой, чем при продуцировании письменной речи, которая предполагает большую подготовленность, более осознанный выбор языковых средств и само порождение которой представляет собой сложную когнитивную задачу, причем это касается как многостраничного художественного произведения, так и текста в 100 слов [16].

В некоторых современных зарубежных исследованиях по изучению «ложных» текстов параметры для анализа языкового материала выбираются именно с учетом данных о связи лжи с повышенной когнитивной нагрузкой.

Так, например, в работе [17] было показано, что в «ложных» устных нарративах снижается уровень связности, когерентности текста, для них характерны большее количество простых предложений, чем сложных, меньший коэффициент синтаксического разнообразия и низкочастотных слов. Как отмечают авторы, 71% всех случаев статистически значимых различий в коэффициенте удобочитаемости, учитывающем количественные характеристики текста на разных уровнях с точки зрения простоты/сложности понимая текста адресатом (Flesch Kincaid Grade Level), объясняется именно отнесенностью текста к «ложным» или «правдивым». В указанном исследовании делается вывод о том, что «ложные» тексты отличаются меньшей языковой сложностью по сравнению с «правдивыми» текстами, полученными от одного и того же респондента. Однако существуют работы, в которых показано, что в ситуации повышенной когнитивной нагрузки (при выполнении параллельной задачи наряду с выполнением речевых заданий; анализировалась устная речь) грамматическая сложность высказываний увеличивается, однако лексическое разнообразие речи падает [18].

Таким образом, новейшие достижения нейронаук свидетельствуют о том, что ложь - очень сложное и неоднородное явление и для ее идентификации необходимо учитывать целый ряд факторов: условия продуцирования лжи, степень подготовленности ложного высказывания, тему, жанр текста, форму речи (устная или письменная), особенности личности ее продуцента и некоторые другие. Представляется, что именно с недооценкой указанного факта, а также с отсутствием комплексного, системного подхода к анализу речевой продукции могут быть связаны имеющиеся противоречивые данные о наиболее эффективных языковых маркерах лжи.

Естественно предположить, что в связном тексте как продукте речемыслительной деятельности отражаются особенности работы мозга во время продуцирования лжи. Кроме того, как отмечается в литературе, на процессы, связанные с ложью, влияют и индивидуально-психологические характеристики человека. Представляется, что для выявления особенностей организации «ложных» текстов необходим целостный многоуровневый анализ речевого произведения на основе современных представлений о стадиях порождения текста с последующей интерпретацией полученных результатов с учетом, с одной стороны, данных нейробиологии об активации тех или иных зон мозга во время продуцирования лжи и с другой стороны - данных нейролингвистики об ответственности тех или иных зон мозга за продуцирование различных языковых элементов.

СПИСОК ЛИТЕРАТУРЫ:

1. Vrij A. Detecting Lies and Deceit: pitfalls and opportunities / A. Vrij. - Chichester : John Wiley & Sons, 2008. - 488 p.
2. Лурия A.P. Экспериментальная психология в судебно-следственном деле / А.Р. Лурия // Советское право. - 1927. - № 2(26). - С. 84-100.
3. Леонтьев А.А. Речь в криминалистике и судебной психологии / А.А. Леонтьев, A.M. Шахнарович, В.И. Батов. - М., 1977. - 62 с.
4. Литвинова Т.А. Поиск признаков лжи в письменном тексте: современные методы и подходы / Т.А. Литвинова, П.В. Середин // В мире науки и искусства: вопросы филологии, искусствоведения и культурологи : материалы XXIV Международной заочной научно-практической конференции [10 июня 2013 года]. - Новосибирск : СибАК, 2013. - С. 126-133.
5. Ленец А.В. Коммуникативный феномен лжи: лингвистический и семиотический аспекты : дис. ... д-ра филол. наук / А.В. Ленец. - Ростов-на-Дону, 2010. - 392 с.
6. Шаховский В.И. Человек лгущий в реальной и художественной коммуникации / В.И. Шаховский // Человек в коммуникации: аспекты исследования. - Волгоград, 2005. - (http://www.russcomm.ru/rca_biblio/sh/shakhovsky04.shtml).
7. Литвинова Т.А. Выявление в тексте намеренно искаженной информации с учетом индивидуальных особенностей его автора: к постановке проблемы / Т.А. Литвинова // Слово, высказывание, текст в когнитивном, прагматическом и культурологическом аспектах : материалы VII Междунар. науч. конф. (Челябинск, 21-23 мая 2014 года). - Челябинск, 2014. - С. 314-317.
8. Диагностирование истинности/ложности высказывания как одно из направлений моделирования личности автора письменного текста / Т.А. Литвинова [и др.] // В мире науки и искусства : вопросы филологии, искусствоведения и культурологии: материалы XXIV Международной заочной научно-практической конференции [10 июня 2013 года]. - Новосибирск : СибАК, 2013. - С. 120-125.
9. Zhou L. Automating linguistics-based cues for detecting deception in asynchronous computer-mediated communications / L. Zhou, J.K. Burgoon, J.F. Nunamaker, D. Twitchell // Group Decision and Negotiation. - 2004. - № 13. - P. 81-106.
10. Burgoon J.K. Detecting Deception in the Military Infosphere: Improving and Integrating Human Detection Capabilities with Automated Tools: Technical Report / J.K. Burgoon, J.F. Nunamaker, J. George. - Arizona Univ Tucson Center for the Management of Information, 2007. - 150 p.
11. Kozel F.A. Replication of Functional MRI Detection of Deception / F.A. Kozel [et al.] // Open Forensic Sci. -
2009. - № 2. - P. 6-11.
12. Mar R.A. The neuropsychology of narrative: story comprehension, story production and their interrelation / R.A. Mar // Neuropsychologia. - 2004. - № 42. - P. 1414-1434.
13. Киреев M.B. Исследование методом функциональной магнитно-резонансной томографии мозгового обеспечения сознательной лжи / М.В. Киреев, А.Д. Коротков, С.В. Медведев // Физиология человека. - 2012. - Т. 38. - № 1. - С. 41-50.
14. Nobuhito A. The neurobiology of deception: evidence from neuroimaging and loss-of-function studies / A. No- buhito // Current Opinion in Neurology 2009. - № 22. - P. 594-600.
15. Sip K.E. Detecting deception: the scope and limits / K.E. Sip, A. Roepstorff, W.B. McGregor, C.D. Frith // Trends Cogn. Sci. - 2008. - № 12. - P. 48-53.
16. Kellogg R.T. The Psychology of Writing / R.T. Kellogg. - Oxford University Press, 1999. - 254 p.
17. Bedwell J.S. Linguistic correlates of self in deceptive oral autobiographical narratives / J.S. Bedwell, S. Gallagher, S.N. Whitten, S.M. Fiore // Conscious Cogn. - 2011. - № 20(3). - P. 547-555.
18. Khawaja M.A. Analysis of Collaborative Communication for Linguistic Cues of Cognitive Load / M.A. Khawa- ja, F. Chen, N. Marcus // International Journal of Human Factors and Ergonomic Society. - 2012. - № 54(4). - P. 518-29.

Известия ВГПУ. Педагогические науки № 2 (267), 2015

Категория: Филология и перевод | Добавил: x5443 (30.05.2017)
Просмотров: 101 | Теги: ложь, лингвистика | Рейтинг: 5.0/1
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
...




Copyright MyCorp © 2017 Обратная связь