Роджер Эберт: Как я воссоздал свой голос

Когда кинокритик Роджер Эберт из-за рака потерял нижнюю челюсть, он потерял способность есть и говорить. Но он не потерял голос. Эберт, его жена Чез и их друзья Дин Орниш и Джон Хантер вместе пришли на волнующий разговор от TED2011, чтобы рассказать свою удивительную историю.

TED from Voice Fabric on Yandex.Video

Это мои слова, но это не мой голос. Это Алекс, лучший компьютерный голос, который я смог найти, и который поставляется в стандартном наборе вместе с любым Macintosh’ем. На протяжении большей части моей жизни я не задумывался насчёт моей способности говорить. Это было как дышать. В те дни я жил в обманчивом раю. Когда операция по удалению рака отняла у меня способность говорить, есть и пить, я был вынужден войти в этот виртуальный мир, где компьютер заменяет некоторые аспекты моей жизни.

Вот уже несколько дней на TED мы наслаждаемся блестящими и выразительными выступлениями ораторов. Я тоже мог говорить так. Может быть, я был не такой умный, но по крайней мере такой же разговорчивый. Я хочу посвятить свое выступление сегодня акту говорения как таковому и тому, как говорение или не говорение неразрывно связано с личностью человека и может дать толчок рождению новой личности, если отобрать у него этот дар. Однако, я обнаружил, что если слушать компьютерный голос достаточно долго, он может показаться монотонным. Поэтому я завербовал некоторых моих друзей по TED, чтобы они читали вслух мои слова. Пусть начнёт моя жена Чез.

Чез Эберт: «Именно Чез поддерживала меня во время трёх попыток реконструировать мою челюсть и восстановить способность говорить. Идя на первую операцию по поводу рецидива рака слюнных желез в 2006 году, я думал, что выйду из больницы вовремя, чтобы вернуться к моим шоу с обзорами фильмов, „Эберт и Ропер о кино“. Я заранее записал достаточно шоу, чтобы посвятить шесть недель операции и восстановлению сил. Врачи взяли часть малоберцовой кости из моей ноги и некоторые ткани из моего плеча, чтобы собрать из них новую челюсть. Язык, гортань и голосовые связки были здоровы и без изменений.»

(Смех в зале)

(Смех в зале)

«Я чувствовал оптимизм, и ситуация казалась нормальной. Первая операция прошла с большим успехом. Посмотрев на себя в зеркало, я увидел, что выгляжу достаточно хорошо. Через две недели я был готов вернуться домой. Я поставил песню Леонарда Коэна „Я твой“ на моём IPod’е для моих врачей и медсестер. Неожиданно у меня началось ужасное кровотечение. Это был разрыв сонной артерии. Слава Богу, я все еще был в больнице, и мои врачи были рядом. Чез сказала мне, что если бы эта песня не была такой длинной, возможно, я был бы уже в машине по дороге домой и умер бы прямо на месте. Так что спасибо тебе, Леонард Коэн, за спасение моей жизни.»

(Аплодисменты)

«Была вторая операция, результаты которой продержались пять-шесть дней и развалились. А потом — третья попытка, когда меня очень здорово залатали, но кончилось всё плохо. Врач из Бразилии сказал, что он никогда не видел, чтобы кто-либо выжил после разрыва сонной артерии. Прежде чем я вышел из больницы после того, как провёл там год, у меня было семь разрывов сонной артерии.

Не было такого, чтобы кто-то однажды сказал мне, что я никогда больше не буду говорить — это просто стало очевидной вещью. Человеческая речь — это искусная манипуляция дыханием в пределах ротовой полости и дыхательной системы. Чтобы формировать звуки речи, мы должны быть в состоянии удерживать дыхание и манипулировать им. Таким образом, система должна быть достаточно герметична, чтобы удерживать воздух. Поскольку я потерял челюсть, я не мог создавать закрытый объем, поэтому мой язык и другие части голосового аппарата становились бесполезными.»

Дин Орниш: «Сначала довольно долго я писал сообщения в записных книжках. Затем я попытался набирать слова на ноутбуке и использовать встроенный голос. Это было быстрее, и никому не приходилось разбирать мой почерк. Я опробовал разные компьютерные голоса из Интернета, и несколько месяцев у меня был британский акцент, который Чез называла сэр Лоренс." (Смех в зале) «Он был самым чётким из тех, что я нашел. Потом Apple выпустила голос Алекса, который оказался лучшим, что я слышал. Он понимал такие вещи, как разница между восклицательным и вопросительным знаками. Когда он видел точку, он знал, как заставить предложение звучать так, что оно закончилось, а не повисло в воздухе. Есть куча HTML-кодов, при помощи которых можно управлять временем и интонацией компьютерного голоса, и я экспериментировал с ними. Но для меня все они имеют ту же проблему: они медленные. Когда я нахожусь в процессе беседы, Мне нужно набирать быстро, чтобы успевать за другими. Люди же не имеют времени или терпения, чтобы дожидаться меня, пока я валяю дурака с кодами для каждого слова или фразы.

Но какое значение мы придаем звуку собственного голоса? Как он влияет на вашу личность? Когда люди слышат, как Алекс произносит мои слова, чувствуют ли они несоответствие? Создаёт ли это разъединение или дистанцию между одним и другим человеком? Что я чувствую, будучи не в состоянии говорить? Я чувствовал и всё ещё чувствую большую дистанцию с человеческим потоком. Если у меня нет доступа к ноутбуку, я чувствую себя неуютно. Кроме того, я знаю, что у большинства не хватает терпения, чтобы выдержать мои трудности с речью.

Тогда Чез предложила найти компанию, которая могла бы создать специальный голос из записей моего голоса для телешоу, сделанных за 30 лет. Сначала я был против этого. Я думал, что будет жутко слышать свой собственный голос, идущий от компьютера. Было что-то успокаивающее в голосе, который не был моим собственным. Но я решил просто попробовать. Итак, мы связались с компанией в Шотландии, которая создавала персонализированные компьютерные голоса. Они никогда не работали с заранее записанными материалами. Все их голоса были сделаны из записей исходных слов, сделанных диктором в студии. Но они захотели попробовать.

Так что я послал им много часов записей моего голоса, в том числе несколько аудио-треков комментариев, что я сделал для фильмов на DVD. И это действительно звучало, как я сам. Этому была причина: это и был я. Но это было не так просто. Записи моего телешоу были не очень полезны, потому что там было слишком много других звуков — саундтреков к фильмам, например, или как Джин Сискель спорит со мной." (Смех в зале) «И мои слова часто имели определённое ударение, которое плохо вписывалось в обычную фразу.

Я дам послушать образец этого голоса. Это несколько комментариев, которые я записал, когда мы с Чез участвовали в программе Опры Уинфри. Это голос, который мы называем Роджер младший, или Роджер 2.0».

Роджер 2.0: Опра, я не могу вам передать, как это здорово быть снова на вашем шоу. Мы уже разговаривали довольно долго, и вот теперь мы снова здесь. Это первая версия моего компьютерного голоса. Он по-прежнему нуждается в улучшении, но по крайней мере он звучит, как я, а не как HAL 9000 [бортовой компьютер из «Космической одиссеи» Артура Кларка]. Когда я впервые услышал его, мурашки побежали у меня по спине. Когда я что-нибудь наберу на клавиатуре, голос произнесет то, что я набрал. Когда я читаю что то, он прочитает моим голосом. Я набрал эти слова заранее, потому что вряд ли вам покажется волнующим зрелищем то, как я буду сидеть здесь и набирать слова.

Голос был создан компанией в Шотландии под названием CereProc. Мне приятно вспомнить, что многие слова, которые вы слышите, были произнесены мною, когда я комментировал фильмы «Касабланка» и «Гражданин Кейн». Это первый голос, который они создали для конкретного человека. Есть несколько очень хороших компьютерных голосов, но все они звучат, как кто-то другой, в то время как этот голос звучит как я. Я хочу использовать его на телевидении, радио и в Интернете. Люди, которым нужен голос, должны знать, что большинство компьютеров уже поставляется со встроенными системами речи. Многие слепые люди пользуются ими, когда они читают Интернет-страницы. Но я должен сказать, в первом классе мне сказали, что я очень много говорю, а сейчас, я всё ещё могу говорить.

(Смех в зале)

Роджер Эберт: Как вы можете слышать, это звучит как я, но интонация прыгает то выше, то ниже. Нет естественного потока. Эти славные люди из Шотландии всё ещё улучшают мой голос, и я настроен оптимистично. Но до сих пор голос «Алекс» компании Apple остаётся лучшим, что я слышал. Я написал об этом в блоге и получил комментарий от актера, который записывал Алекса. Он сказал, что пришлось делать многочасовые записи в разных интонациях, которые затем использовались в этом голосе. Необходима очень большая выборка.

Джон Хантер: «Всю жизнь я был говоруном. На данный момент я уже произнёс мои последние слова, и я даже не помню точно, какие это были слова. Я чувствую себя как герой этой истории Харлана Эллисона под названием „У меня нет рта и я должен кричать“. В среду Дэвид Кристиан объяснил нам, какой крошечный момент представляет жизнь человеческой расы во временном масштабе Вселенной. Почти все эти миллионы и миллиарды лет на Земле вообще не было никакой жизни. Почти всё время, когда жизнь была на Земле, это была неразумная жизнь. Лишь после того как мы научились передавать знания от одного поколения к другому, цивилизация стала возможной. В космологическом масштабе это случилось примерно 10 минут назад. Наконец появился самый передовой и таинственный инструмент человечества — компьютер. Это в основном произошло в течение моей жизни.

Некоторые из известных ранних компьютеров были построены в моем родном городе Урбана, на родине HAL 9000. Когда в среду я услышал удивительное выступление Салмана Хана о сайте Академии Хана, где студентам со всего мира преподают сотни предметов, я кое-что вспомнил. Это было в 1960-х. Как репортер местный газеты, будучи ещё школьником, я был направлен в компьютерную лабораторию университета Иллинойса, чтобы взять интервью у создателей системы под названием PLATO [Платон]. Это расшифровывалось как запрограммированная логика для автоматизированных учебных процессов. Это была компьютерная система обучения, которая в те дни работала на компьютере ILLIAC. Программисты сказали, что она может помочь студентам в их обучении.

Я сомневаюсь, что тогда, 50 лет назад, они даже мечтали о том, что сделал Салман Хан. Но не в этом суть. Суть в том, что PLATO возникла всего 50 лет назад, — так недавно, — и она продолжала развиваться и работать в той или иной форме на всё более и более сложных компьютерах, до момента всего пять лет назад. Я узнал из Википедии, что, начав настолько скромно, PLATO создала форумы, доски объявлений, онлайн-тестирование, электронную почту, чаты, языки в картинках, обмен мгновенными сообщениями, удалённое использование экрана и игры для нескольких игроков.

Так как первый веб-браузер был также разработан в Урбане, похоже, что мой родной город в штате Иллинойс стал местом рождения большей части виртуальной онлайн-вселенной, которую мы знаем сегодня. Но я здесь не по поручению Торгово-промышленной палаты». (Смех в зале) «Я здесь как человек, который хочет общаться.

Всё это произошло в течение моей жизни. Я начал писать на компьютере еще в 1970-х, когда в „Чикаго Сан Таймс“ установили одну из первых систем Atech. Я стоял в очереди в магазине Radio Shack, чтобы купить одну из первых 100-х моделей. И когда я сказал людям в пресс-центре Academy Awards, что им нужно установить несколько телефонных линий для подключения к Интернету, они не понимали, о чём я говорю. Потом я купил свой первый настольный компьютер, — это был DEC Rainbow. Кто-нибудь помнит, что это такое?» (Аплодисменты) «„Сан Таймс“ послала меня на Каннский кинофестиваль с портативным компьютером размером с чемодан под названием Porteram Telebubble. Я вступил в Compuserve, когда там было меньше номеров, чем сейчас пользователей, читающих мой Twitter.»

(Смех в зале)

Ч.Э.: «Все это произошло в мгновение ока, и я не могу даже представить, что произойдёт дальше. Мне невероятно повезло жить в этот момент в истории. На самом деле мне повезло жить в истории вообще, потому что без интеллекта и памяти нет никакой истории. В течение миллиардов лет вселенная развивалась вообще без каких-либо записей. Сейчас мы живем в эпоху Интернета, который, кажется, превращается в что-то вроде планетарного сознания. И благодаря ему я могу общаться, как я мог и раньше. Мы родились в коробке времени и пространства. Мы используем слова и связь, чтобы вырваться из неё и обратиться к другим.

Я открыл для себя Интернет как полезный инструмент, но сейчас он стал чем то, на что я полагаюсь в реальной повседневной жизни. Я не могу говорить, я могу только быстро печатать. Компьютерные голоса иногда не достаточно хорошо работают, но всё-же при помощи компьютера я могу общаться ещё более широко, чем когда-либо прежде. Мне кажется, что мой блог, моя электронная почта, Twitter и Facebook заменили мне повседневные разговоры. Полностью они не спасают, но они — лучшее, что у меня есть. Они дают мне возможность говорить. Не у всех есть терпение как моей жены, Чез. Но в Интернете все говорят с одинаковой скоростью.

Всё это приключение оказалось очень поучительным. Каждый раз после очередной неудавшейся операции у меня оставалось всё меньше плоти и костей. Теперь у меня вообще нет челюсти. Хирурги собрали ткани с обоих моих плеч, и теперь меня мучают боли в спине, и я не могу свободно ходить. Парадоксально, что с ногами-то всё в порядке, а быстро ходить мешают именно плечи. Посмотрите на меня сегодня. Я похож на призрак оперы».

Ничего подобного!

(Смех в зале)

(Аплодисменты)

«Людям свойственно, когда они смотрят на такого как я, думать, что у меня не всё в порядке с головой. Люди…» (Аплодисменты) «Люди говорят со мной…»

Извините. Простите меня.

(Аплодисменты)

«Люди говорят со мной громко и медленно. Иногда им кажется, что я глухой. Есть люди, которые не хотят смотреть мне в глаза».

Поверьте мне, он не имел в виду, что… Ладно, я просто буду читать дальше. (Смех в зале) Никогда не заставляйте вашу жену читать что-то подобное.

(Смех в зале)

«Это в человеческой природе — отводить взгляд от болезни. Мы никогда не рады напоминаниям о нашей хрупкости и смертности. Вот почему писать в Интернете стало для меня спасением. Моя способность думать и писать не пострадала, и в Интернете мой настоящий голос находит своё выражение. Я также встречался со многими другими инвалидами, которые общаются таким образом. Один из моих друзей на Twitter’е может набирать на клавиатуре только пальцами ног. Один из самых смешных блогов в Интернете ведётся моим другом под ником SmartAss Cripple». [«Хитрозадый калека»] (Смех в зале) «Погуглите его, и вы от души посмеётесь. Все эти люди в той или иной форме доказывают, что внешняя оболочка — это ещё далеко не всё.

Так что я пришёл сюда не жаловаться. У меня есть достаточно, чтобы я мог быть счастлив и свободен. Кажется, на данный момент у меня и рака нет. Я пишу как всегда. Я продуктивен. Если бы я оказался в таком состоянии всего лишь несколько космологических мгновений назад, я был бы изолирован как отшельник. Я оказался бы в ловушке внутри своей головы. Но благодаря стремительному росту человеческих знаний, благодаря цифровой революции у меня есть голос, и мне не нужно кричать.»

Р.Э.: Подождите. Я хочу добавить ещё кое-то. Приходит мужик к психиатру. Психиатр говорит: «Ты сумасшедший». Мужик говорит: «Я хочу услышать другое мнение». Психиатр говорит: «Ладно, ты ещё и урод».

(Смех в зале)

Вы все знаете о тесте для искусственного интеллекта, тесте Тьюринга. Человеческий арбитр проводит беседу с человеком и компьютером. Если арбитр не может отличить машину от человека, то машина прошла тест. Сейчас я предложил вам тест компьютерного голоса — тест Эберта. Если компьютерный голос может успешно рассказать анекдот со всеми паузами и подачей, как у Хенни Янгмана, [комедиант, известный шутками в одну строку] то я хочу этот голос.

(Аплодисменты)

TED.com
Перевод: Андрий Прищенко
Озвучено: Центр речевых технологий