Но если искать осмысленное слово, то самым длинным будет считаться слово, которое было изобретено не с целью поставить рекорд по длине лексической единицы, а появилось в 1964 году в реферативном журнале Chemical Abstracts, который служит для химиков своеобразным справочником. Это слово обозначает важнейший белок, который считается первым из открытых вирусов. Этот белок вируса табачной мозаики был открыт в 1892 году и называется – набрали в грудь воздуха: ацетилсерилтиросилсерилизолейцилтреонилсерилпролилсерилглютаминилфенилаланилвалифенилаланиллейцилсерилсеривалитриптофилаланиласпартилпролилизолейцилглютамиллейциллейциласпарагинилвалилцистейнилтреонилсерилсериллейцилглициласпарагинилглютаминилфенилаланилглютаминилтреонилглютаминилглютаминилаланиларгинилтреонилтреонилглютаминилвалилглютаминилглютаминилфенилаланилсерилглютаминилвалилтриптофиллизилпролифенилаланилпролилглютаминилсерилтреонилвалиларгинилфенилаланилпролиглициласпартилвалилтирозиллизилвалилтирозиларгинилтирозиласпарагинилаланилвалиллейциласпартилпролиллейцилизолейцилтреонилаланиллейциллейцилглицилтреонилфенилаланиласпартилтреониларгиниласпарагиниларгинилизолейцилизолейцилглютамилвалилглютамиласпарагинилглютаминилглютаминилсерилпролилтреонилтреонилаланилглютамилтреониллейциласпартилаланилтреониларгиниларгинилвалиласпартиласпартилаланилтреонилвалилаланилизолейциларгинилсерилаланиласпаргинилизолейциласпаргиниллейцилвалиласпарагинилглютамиллейцилвалиларгинилглицилтреонилглициллейцилтирозиласпарагинилглютаминиласпарагинилтреонилфенилаланилглютамилсерилметионилсерилглициллейцилвалилтриптофилтреонилсерилаланилпролилаланилсерин.
Эта анаконда по-английски записывается 1185 буквами[15], а по-русски – всего 1148 буквами.
Теперь, когда большинство из вас просто пробежали глазами приведенное название, возможно, восприняв только «ацетил» и «серин», давайте еще раз взглянем на это слово. Распределение букв в нем оказывается довольно интересным. Буква «е», самая распространенная в английском языке, встречается 65 раз, буква «у» – наименее распространенная – целых 183 раза. Всего на одну букву, «l», приходится 22 % слова (255 раз). Причем буквы «у» и «l» разбросаны не как попало, а зачастую встречаются рядом друг с другом – они образуют 166 пар, расположенных с интервалом около 7 букв. Все это неслучайно. Рассматриваемое нами длинное слово – это название белка, а белки построены на основе шестого, наиболее многофункционального элемента периодической системы – углерода.
В частности, атомы углерода образуют каркасы аминокислот, которые соединяются друг с другом как бусины, образуя белки. Белок вируса табачной мозаики состоит из 159 аминокислот. Поскольку биохимикам зачастую приходится подсчитывать множество аминокислот, они следуют простому лингвистическому принципу. Принято отсекать от названия аминокислоты суффикс «ин» – как в словах «серин» или «изолейцин» – и заменять на «ил», чтобы получался компонент «серил» или «изолейцил». Если расположить эти «илы» в правильном порядке, они точно описывают структуру белка. Мы с вами, не будучи лингвистами, легко понимаем значение составных слов. Так и биохимики в 1950-е годы и начале 1960-х годов давали молекулам официальные наименования вроде «ацетил…серин», чтобы можно было воссоздать формулу молекулы по ее названию. Это точная, хотя и сложная система. Тенденция к соединению корней и созданию составных слов исторически сложилась из-за того, что в развитии химии важнейшую роль сыграли немецкие ученые и немецкий язык, богатый сложными и длинными словами.