[xiph-commits] r17482 - websites/xiph.org/video
giles at svn.xiph.org
giles at svn.xiph.org
Mon Oct 4 07:34:49 PDT 2010
Author: giles
Date: 2010-10-04 07:34:49 -0700 (Mon, 04 Oct 2010)
New Revision: 17482
Added:
websites/xiph.org/video/vid1-ru.srt
Modified:
websites/xiph.org/video/vid1.shtml
Log:
Russian subtitles, thanks to Igor Mitrenko.
Added: websites/xiph.org/video/vid1-ru.srt
===================================================================
--- websites/xiph.org/video/vid1-ru.srt (rev 0)
+++ websites/xiph.org/video/vid1-ru.srt 2010-10-04 14:34:49 UTC (rev 17482)
@@ -0,0 +1,1584 @@
+1
+00:00:08,124 --> 00:00:10,742
+Рабочие станции и топовые персональные компьютеры справляются
+
+2
+00:00:10,742 --> 00:00:14,749
+с обработкой цифрового звука довольно легко последние пятнадцать лет.
+
+3
+00:00:14,749 --> 00:00:17,470
+Только около пяти лет приличные рабочие станции способны
+
+4
+00:00:17,470 --> 00:00:21,643
+справляться с несжатым видео без кучи дорогого специализированного оборудования
+
+5
+00:00:21,643 --> 00:00:25,400
+Но сегодня даже самый дешовый домашний компьютер имеет процессор и
+
+6
+00:00:25,400 --> 00:00:28,092
+жесткий диск, необходимые, чтобы реально раскидывать несжатое видео,
+
+7
+00:00:28,092 --> 00:00:30,479
+по крайней мере, без излишнего напряжения.
+
+8
+00:00:30,479 --> 00:00:33,579
+Итак, теперь, когда у каждого есть все это необходимое недорогое оборудование,
+
+9
+00:00:33,579 --> 00:00:36,651
+все больше людей, что неудивительно, хотят заниматься интересными
+
+10
+00:00:36,651 --> 00:00:39,908
+вещами с цифровым контентом, особенно потоковым воспроизведением.
+
+11
+00:00:39,908 --> 00:00:44,017
+Ну хорошо! Потому что это очень весело!
+
+12
+00:00:44,017 --> 00:00:47,413
+Совсем не проблема найти потребителя цифрового контента.
+
+13
+00:00:48,250 --> 00:00:51,179
+Но здесь я бы хотел обратиться к инженерам, к математикам,
+
+14
+00:00:51,179 --> 00:00:54,649
+хакерам, людям, заинтересованным в открытиях,
+
+15
+00:00:54,649 --> 00:00:57,869
+создании вещей и самом создании технологий.
+
+16
+00:00:57,869 --> 00:01:01,302
+Людям, близким мне по духу.
+
+17
+00:01:01,302 --> 00:01:03,282
+Цифровой контент, особенно сжатие, воспринимается как что-то сверх-элитное,
+
+18
+00:01:04,250 --> 00:01:08,723
+почему-то невероятно более сложное, чем что-либо другое в компьютерной науке.
+
+19
+00:01:08,723 --> 00:01:12,822
+Крупные индустриальные игроки в этой области вообще не против такого восприятия;
+
+20
+00:01:12,822 --> 00:01:15,700
+это помогает оправдывать ошеломляющее количество самых основных патентов, которые они держат.
+
+21
+00:01:15,700 --> 00:01:19,734
+Им нравится образ, представляющий их исследователи - лучшие из лучших,
+
+22
+00:01:19,734 --> 00:01:23,870
+настолько умнее всех остальных, что их блестящие идеи даже не могут
+
+23
+00:01:23,870 --> 00:01:27,738
+быть даже поняты простыми смертными.
+
+24
+00:01:27,738 --> 00:01:29,903
+Это чушь.
+
+25
+00:01:30,625 --> 00:01:33,716
+Цифровое ауидо, видео, потоковая передача и сжатие
+
+26
+00:01:35,205 --> 00:01:38,900
+представляют бесконечно глубокие и стимулирующие умственные испытания,
+
+27
+00:01:38,900 --> 00:01:42,738
+как и любая другая дисциплина.
+
+28
+00:01:42,738 --> 00:01:44,662
+Это выглядит элитным, потому что так мало людей вовлечены.
+
+29
+00:01:44,662 --> 00:01:47,929
+Так мало людей были вовлечены, возможно, потому, что так мало людей
+
+30
+00:01:47,929 --> 00:01:51,223
+могли позволить себе необходимое дорогое специализированное оборудование.
+
+31
+00:01:51,223 --> 00:01:54,665
+Но сегодня почти любой смотрящий это видео, имеет дешовый
+
+32
+00:01:54,665 --> 00:01:58,792
+универсальный компьютер, достаточно мощный, чтобы играть с большими парнями.
+
+33
+00:01:58,792 --> 00:02:03,317
+Сегодня идут сражения вокруг HTML5, браузеров,
+
+34
+00:02:05,926 --> 00:02:11,108
+видео и открытого против закрытого.
+
+35
+00:02:11,108 --> 00:02:13,671
+Поэтому, сейчас самое подходящее время принять участие.
+
+36
+00:02:13,671 --> 00:02:17,048
+Легче всего начать, возможно, с понимания
+
+37
+00:02:17,048 --> 00:02:20,000
+технологиии, которая у нас есть сейчас.
+
+38
+00:02:20,000 --> 00:02:22,619
+Это - вступление.
+
+39
+00:02:23,500 --> 00:02:25,071
+Поскольку это - вступление, оно приукрашивает массу деталей,
+
+40
+00:02:25,071 --> 00:02:28,180
+так что большую картину несколько легче понять.
+
+41
+00:02:28,180 --> 00:02:30,882
+Порядочное число смотрящих уже знакомы со всем,
+
+42
+00:02:30,882 --> 00:02:33,908
+о чем я буду говорить, по крайней мере пока.
+
+43
+00:02:33,908 --> 00:02:36,378
+С другой стороны, возможно, я буду рассказывать слишком быстро для тех,
+
+44
+00:02:36,378 --> 00:02:39,293
+кто совсем не знаком со всем этим, поэтому, если все это ново для вас, расслабьтесь.
+
+45
+00:02:39,293 --> 00:02:44,558
+Важно выделить все идеи, которые действительно захватывают ваше воображение.
+
+46
+00:02:44,558 --> 00:02:48,629
+Особенно уделите внимание терминологии, связанной с этими идеями,
+
+47
+00:02:48,629 --> 00:02:52,497
+потому что с ними, а так же с Гуглом и Википедией, вы можете копать
+
+48
+00:02:52,479 --> 00:02:56,078
+настолько глубоко, насколько вы заинтересованы.
+
+49
+00:02:56,078 --> 00:02:57,753
+Итак, без лишних церемоний,
+
+50
+00:02:57,753 --> 00:03:00,094
+добро пожаловать в удивительно хорошее хобби.
+
+51
+00:03:00,094 --> 00:03:03,351
+Звук - это распространение волн давления по воздуху,
+
+52
+00:03:10,291 --> 00:03:13,030
+расходящихся от источника подобно кругам на воде от брошенного в пруд камня.
+
+53
+00:03:13,030 --> 00:03:16,981
+Микрофон, или человеческое ухо в его роли,
+
+54
+00:03:16,981 --> 00:03:19,489
+преобразовывает эту распространяющуюся пульсацию в электрический сигнал.
+
+55
+00:03:19,489 --> 00:03:22,876
+Верно, это куср средней школы, это помнит каждый.
+
+56
+00:03:22,876 --> 00:03:25,800
+Двигаемся дальше.
+
+57
+00:03:25,800 --> 00:03:26,771
+Этот аудиосигнал является одномерной функцией, единственным значением, изменяющимся во времени.
+
+58
+00:03:27,465 --> 00:03:32,527
+Если мы немного замедлим осцилограф...
+
+59
+00:03:32,527 --> 00:03:34,248
+это будет несколько легче увидеть.
+
+60
+00:03:36,450 --> 00:03:38,190
+Также важны несколько други аспектов сигнала.
+
+61
+00:03:38,190 --> 00:03:40,688
+Он непрерывен и во времени в значениях;
+
+62
+00:03:40,688 --> 00:03:43,418
+то есть, в любой момент времени у него есть действительное значение,
+
+63
+00:03:43,418 --> 00:03:46,813
+а также его значение плавно меняется от одной точки во времени к другой.
+
+64
+00:03:46,813 --> 00:03:50,228
+Не важно, насколько мы увеличиваем,
+
+65
+00:03:50,228 --> 00:03:52,439
+не будет никаких разрывов, сингулярностей или мгновенных изменений значений
+
+66
+00:03:54,068 --> 00:03:58,510
+или точек, в которых сигнал прекращает существовать.
+
+67
+00:03:58,510 --> 00:04:01,285
+Он определён везде. Классическая непрерывная математика хорошо применима к этим сигналам.
+
+68
+00:04:03,247 --> 00:04:08,475
+Цифровой сигнал, с другой стороны, является дискретным по значению и по времени.
+
+69
+00:04:11,001 --> 00:04:15,378
+В самой простой и наиболее общепринятой системе, которая называется "импульсно-кодовая модуляция",
+
+70
+00:04:15,378 --> 00:04:19,107
+каждое из фиксированного числа значений напрямую представляет амплитуду непрерывного сигнала
+
+71
+00:04:19,107 --> 00:04:24,058
+в точках времени, разделённых равными промежутками. Конечным результатом является поток чисел.
+
+72
+00:04:24,058 --> 00:04:30,165
+Теперь это выглядит ужасно похоже на это.
+
+73
+00:04:30,674 --> 00:04:35,309
+Кажется интуивиным, что должен быть способ как-то строго преобразовывать
+
+74
+00:04:35,309 --> 00:04:38,964
+одно в другое, и, хорошие новости, теорема отсчетов гласит, что мы может, и рассказывает, как.
+
+75
+00:04:38,964 --> 00:04:44,683
+Опубликованная в своей самой узнаваемой форме Клодом Шенноном в 1949
+
+76
+00:04:44,683 --> 00:04:48,477
+и основанная на работах Найквиста и Хартли, и многих других,
+
+77
+00:04:48,477 --> 00:04:52,409
+теорема отсчетов не только утверждает, что мы можем переходить туда-обратно между
+
+78
+00:04:52,409 --> 00:04:56,138
+аналоговым и цифровым представлением, но также устанавливает ряд условий, при которых конверсия
+
+79
+00:04:56,138 --> 00:05:00,913
+происходит без потерь и два представления становятся эквивалентными и взаимозаменяемыми.
+
+80
+00:05:00,913 --> 00:05:06,779
+Когда эти условия не вполняются, теорема отсчетов говорит нам,
+
+81
+00:05:06,779 --> 00:05:10,601
+как и сколько информации потеряно или испорчено.
+
+82
+00:05:10,601 --> 00:05:14,247
+До самого последнего времени, аналоговая технология была основой для практически всего для работы со звуком,
+
+83
+00:05:14,900 --> 00:05:21,270
+и не только потому, что большинсвто аудиданных имеют аналоговый источник происхождения.
+
+84
+00:05:21,270 --> 00:05:25,267
+Вы могли подумать, что раз компьютеры появились относительное недавно,
+
+85
+00:05:25,267 --> 00:05:28,450
+технология аналогового сигнала, должно быть, появилась первой.
+
+86
+00:05:28,450 --> 00:05:31,643
+Нет. Цифровая, на самом деле, старше.
+
+87
+00:05:31,643 --> 00:05:34,428
+Телеграф предшествовал телефону на полвека
+
+88
+00:05:34,428 --> 00:05:37,611
+и был почти полностью механически автоматизирован к 1860м, посылая закодированные,
+
+89
+00:05:37,611 --> 00:05:41,951
+мультиплексированные цифровые сигналы на длинные дистанции. Вы знаете... Телеграфная лента.
+
+90
+00:05:41,951 --> 00:05:46,476
+Гарри Найквист из Bell Labs исследовал импульсную телеграфическую передачу,
+
+91
+00:05:46,476 --> 00:05:50,427
+когда опубликовал своё описание того, что потом стало известно как
+
+92
+00:05:50,427 --> 00:05:53,027
+частота Найквиста, ключевая концепция теоремы отсчетов.
+
+93
+00:05:53,027 --> 00:05:57,219
+Теперь, правда в том, что телеграф передавал символьную информацю, текст,
+
+94
+00:05:57,219 --> 00:06:01,642
+а не оцифрованный аналоговый сигнал, но с пришествием телефона и радио
+
+95
+00:06:01,642 --> 00:06:06,883
+технологии аналогового и цифрового сигнала развивались быстро бок о бок.
+
+96
+00:06:06,883 --> 00:06:12,000
+Аудио всегда обрабатывалось как аналоговый сигнал потому что... ну, это настолько легче!
+
+97
+00:06:12,699 --> 00:06:18,732
+Фильтр низких частот второго порядка, например, требует двух пассивных компонентов.
+
+98
+00:06:18,732 --> 00:06:23,257
+Полностью аналогичное кратковременное преобразование Фурье - нескольких сотен.
+
+99
+00:06:23,257 --> 00:06:26,505
+Хорошо, возможно, тысячи, если вы хотите собрать что-то действительно высокого качества.
+
+100
+00:06:26,505 --> 00:06:30,752
+Обрабобтка сигналов цифровым спобом требует от миллионов до миллиардов транзисторов,
+
+101
+00:06:31,844 --> 00:06:35,989
+работающих на микроволновых частотах, аппаратную поддержку по меньшей мере оцифровывки
+
+102
+00:06:35,989 --> 00:06:40,366
+и реконструкции аналоговых сигналов, законченную программную экосистему
+
+103
+00:06:40,366 --> 00:06:43,836
+для программирования и управления этим миллиардно-транзистроным Джаггернаутом,
+
+104
+00:06:43,836 --> 00:06:47,362
+цифровое хранилище, только на тот случай, Если вы хотите сохранить эти биты на будущее...
+
+105
+00:06:47,362 --> 00:06:51,091
+Таким образом, мы приходим к выводу, что только аналоговый подходи практичен для работы с аудио...
+
+106
+00:06:51,091 --> 00:06:56,171
+ну, по крайней мере, если у вас не завалялись миллиард транзисторов и все остальное.
+
+107
+00:06:56,171 --> 00:07:07,019
+А поскольку это так, цифровая обработка сигнала становится очень заманчивой.
+
+108
+00:07:07,850 --> 00:07:12,660
+Во-первых, аналоговые комплектующие просто не имеют гибкости компьютера общего назначения.
+
+109
+00:07:13,363 --> 00:07:18,906
+Добавление новой функции в этого зверя...
+
+110
+00:07:18,906 --> 00:07:21,182
+да, вероятно, это не произойдёт.
+
+111
+00:07:22,191 --> 00:07:24,578
+Хотя на цифровом процессоре...
+
+112
+00:07:24,578 --> 00:07:26,567
+...просто напишите новую программу. Программирование не тривиально, но оно намного легче.
+
+113
+00:07:28,668 --> 00:07:34,127
+...just write a new program. Software isn't trivial, but it is a lot easier.
+
+114
+00:07:34,127 --> 00:07:39,550
+Возможно более важно, что каждый аналоговый компонент является приближением.
+
+115
+00:07:39,550 --> 00:07:44,352
+Не существует такой вещи нак идеальный транзистор или идеальный проводник, или идеальный конденсатор.
+
+116
+00:07:44,352 --> 00:07:51,569
+В аналоговом, каждый компонент добавляет шума и искажений, обычно не очень много, но они суммируются.
+
+117
+00:07:51,569 --> 00:07:55,669
+Только передача аналогового сигнала, особенно на длинные дистацнии,
+
+118
+00:07:55,669 --> 00:08:00,434
+постепенно, умеренно, необратимо портит его.
+
+119
+00:08:00,434 --> 00:08:06,513
+Кроме того, все эти одноцелевые аналоговые компоненты занимают много места.
+
+120
+00:08:06,513 --> 00:08:09,946
+Две строки кода на миллиарде транзисторов здесь
+
+121
+00:08:09,946 --> 00:08:14,702
+могут реализовать фильтр, который бы потребовал индуктора размером с холодильник.
+
+122
+00:08:14,702 --> 00:08:17,941
+Цифровые системы не имеют этих недостатков.
+
+123
+00:08:17,941 --> 00:08:24,335
+Цифровые сигналы могут храниться, копироваться, обрабатываться и передаваться без наложения шумов и искаженй.
+
+124
+00:08:24,335 --> 00:08:26,889
+Да, мы используем время от времени алгоритмы с потерей,
+
+125
+00:08:26,889 --> 00:08:31,284
+но единственно неизбежными неидеальныыми шагами являются оцифровка и восстановление,
+
+126
+00:08:31,284 --> 00:08:35,929
+когда цифровое должно взаимодействовать со всем этим неряшливым аналоговым.
+
+127
+00:08:35,929 --> 00:08:40,750
+Неряшливые или нет, современные этапы преобразования очень, очень хороши.
+
+128
+00:08:40,750 --> 00:08:45,849
+По стандартам наших ушей, мы может считать их также без потерь.
+
+129
+00:08:45,849 --> 00:08:50,429
+С небольшим дополнительным оборудованием, большинство из которого компакнтно и недорого
+
+130
+00:08:50,429 --> 00:08:55,379
+в благодаря нашей современной промышленной инфраструктуре, цифровое ауидо одерживает чистую победу над аналоговым.
+
+131
+00:08:55,379 --> 00:09:00,857
+Давайте тогда перейдем к хранению, копированию, обработке и передаче.
+
+132
+00:09:04,956 --> 00:09:08,639
+Импульсно-кодовая модуляция - самое распространненое представление необработанного аудио.
+
+133
+00:09:08,639 --> 00:09:13,867
+Существуют и другие представления, например, сигма-дельта кодирование, испльзуемое в SACD,
+
+134
+00:09:13,867 --> 00:09:16,625
+которое является формой импульсно-плотностная модуляция.
+
+135
+00:09:16,625 --> 00:09:19,687
+Что говорит, что импульсно-кодовая модуляция значительно доминирующая,
+
+136
+00:09:19,687 --> 00:09:22,158
+главным образом потому, что она так математически удобна.
+
+137
+00:09:22,158 --> 00:09:26,350
+Аудио инженер может провести целую карьеру, не работая ни с чем другим.
+
+138
+00:09:26,350 --> 00:09:29,135
+Кодирование ИКМ можно охарактеризовать тремя параметрами,
+
+139
+00:09:29,135 --> 00:09:34,187
+позволяя посчитать каждый возможный вариант ИКМ без больших хлопотами.
+
+140
+00:09:34,187 --> 00:09:36,426
+Первый параметр - это частота дискретизации.
+
+141
+00:09:36,426 --> 00:09:40,886
+Наивысшая частота, которую кодирование может передать, называется частотой Найквиста.
+
+142
+00:09:40,886 --> 00:09:45,124
+Частота Найквиста ИКМ равняется ровно половиной частоты дискретизации.
+
+143
+00:09:45,124 --> 00:09:51,389
+Следовательно, частота дискретизации непосредственно определяет наивысшую возможную частоту в оцифрованном сигнале.
+
+144
+00:09:51,389 --> 00:09:56,515
+Аналоговые телефонные системы традиционно ограничивали полосу голосовых каналов до чуть менее 4 кГц,
+
+145
+00:09:56,515 --> 00:10:02,224
+поэтмоу цифровая телефония и самые классические голосовые приложения используют частоту дискретизации 8 кГц,
+
+146
+00:10:02,224 --> 00:10:07,277
+минимальную частоту, необходимую для захвата целой полосы в 4 кГц.
+
+147
+00:10:07,227 --> 00:10:14,263
+Вот как звукчит частота дискретизации в 8 кГц--- немного приглушенный, но совсем понятным для голоса.
+
+148
+00:10:17,263 --> 00:10:18,149
+Это самая низкая частота дискретизации, когда-либо широко использованния на практике.
+
+149
+00:10:18,149 --> 00:10:23,322
+С этих пор, с увеличением произвдительности, памяти и накопителей, компьютеры потребителей
+
+150
+00:10:23,322 --> 00:10:29,642
+смогли обеспечить частоту 11, потом 16, потом 22, а потом - 32 кГц.
+
+151
+00:10:29,642 --> 00:10:33,491
+Очевидно, что с каждым увеличением частоты дискретизации и частоты Найквиста,
+
+152
+00:10:33,491 --> 00:10:38,302
+качество звучания топовых конфигураций становится немного чище и звучит более естественно.
+
+153
+00:10:38,301 --> 00:10:44,576
+Компакт-диски используют частоту дискретизации 44,1 кГц, которая слегка лучше, чем 32 кГц,
+
+154
+00:10:44,576 --> 00:10:46,788
+но улучшения становятся менее различимыми.
+
+155
+00:10:46,788 --> 00:10:52,053
+44,1 кГц - это несколько странноватый выбор, особенно при том, что он никогда не использовался
+
+156
+00:10:52,053 --> 00:10:56,559
+до компакт-дисков, но огромный успех компакт-дисков сделал его общепринятой частотой.
+
+157
+00:10:56,559 --> 00:11:01,195
+Наиболее распространненной частотой дискретизации высокого качества за пределами CD является 48 кГЦ.
+
+158
+00:11:05,710 --> 00:11:08,597
+Фактически между ними нет ощутимой разницы в звучании.
+
+159
+00:11:08,597 --> 00:11:13,640
+Это видео, по крайней мере его оригинальная версия, была снята и выпущена с ауидо 48 кГц,
+
+160
+00:11:13,640 --> 00:11:18,545
+что является первоначальным стандартом для высококачественного звука в видоезаписях.
+
+161
+00:11:18,545 --> 00:11:25,100
+Сверхвысококачественные частоты дискретизации в 88, 96 и 192кГц также имели место.
+
+162
+00:11:25,100 --> 00:11:30,888
+Суть в дискретизации на частоте выше 48 кГц заключается не в дальнейшем расширении высокочастотного диапазона.
+
+163
+00:11:30,888 --> 00:11:32,489
+Его суть в другом.
+
+164
+00:11:32,896 --> 00:11:37,319
+Отвлекаясь на секунду, скажу, что французский математик Жан Батист Жозеф Фурье
+
+165
+00:11:37,319 --> 00:11:42,353
+показал, что мы также рассматривать сигналы вроде аудио как набор составлных частот.
+
+166
+00:11:42,353 --> 00:11:45,841
+Это представление частотной области эквивалентно временнОму представлению;
+
+167
+00:11:45,841 --> 00:11:49,719
+сигнал точно такой же, просто мы рассматриваем его по-другому.
+
+168
+00:11:49,719 --> 00:11:56,131
+Здесь мы видим представление частотной области гипотетического аналогового сигнала, который мы собираемся оцифровать.
+
+169
+00:11:56,131 --> 00:11:59,888
+Теорема Найквиста-Шеннона рассказывает о двух вещах, связанных с процессом семплинга.
+
+170
+00:11:59,888 --> 00:12:04,727
+Во-первых, цифровой сигнал не может передавать частоты выше частоты Найквиста.
+
+171
+00:12:04,727 --> 00:12:10,640
+Во-вторых, и это новая часть, если мы не удалим их низкочастотным фильтром перед семплингом,
+
+172
+00:12:10,640 --> 00:12:16,414
+этот процесс обрежет их до допустимого диапазона как искажения наложения.
+
+173
+00:12:16,414 --> 00:12:20,069
+Наложение, в двух словах, звучит ужасно,
+
+174
+00:12:20,069 --> 00:12:25,242
+поэтому естестевнно удалять все частоты ниже частоты Найквиста перед семплином и после восстановления.
+
+175
+00:12:25,871 --> 00:12:31,265
+Считается, что восприятие звука человеком простирается примерно до 20 кГц.
+
+176
+00:12:31,265 --> 00:12:37,548
+При семплинге 44,1 или 48 кГц, фильтрация низких частот перед стадией семплинга должна быть предельно точной,
+
+177
+00:12:37,548 --> 00:12:42,101
+чтобы избежать удаления слышимых частот ниже 20 кГц,
+
+178
+00:12:42,101 --> 00:12:49,439
+и в то же время не допуская попадания частот выше частоты Найквиста в процесс семплинга.
+
+179
+00:12:49,439 --> 00:12:55,342
+Этот тяжело реализуемый фильтр и ни один фильтр на практике не преуспел полностью.
+
+180
+00:12:55,342 --> 00:13:00,024
+С другой стороны, если частота семплинга 96 кГц или 192 кГц,
+
+181
+00:13:00,024 --> 00:13:07,223
+низкочастотный фильтр имеет дополнительно октаву или две в диапазоне модуляции. Такой фильтр намного легче построить.
+
+182
+00:13:07,223 --> 00:13:14,348
+Частоты дискретизации ниже 48 кГц являются на самом деле одним из неприятных компромиссов на аналоговом этапе.
+
+183
+00:13:15,014 --> 00:13:20,844
+Второй фундаментальный параметр ИКМ - это формат выборки, то есть форма каждого цифрового числа.
+
+184
+00:13:20,844 --> 00:13:26,285
+Число - это число, но оно может быть представлено несколькими разными путями.
+
+185
+00:13:26,942 --> 00:13:30,902
+Ранняя ИКМ была линейной 8 битной, кодировалась беззнаковым байтом.
+
+186
+00:13:30,902 --> 00:13:37,028
+Динамический диапазон ограничен примерно 50 дБ и шум квантования, как вы можете слышать, достаточно резкий.
+
+187
+00:13:37,028 --> 00:13:39,970
+Восьмибитное аудио сегодня исчезающе редко.
+
+188
+00:13:41,007 --> 00:13:47,484
+В цифровой телефонии обычно используется одна из двух связанных нелинейных восьмибитных кодировок,
+
+189
+00:13:47,484 --> 00:13:51,287
+называемых А-закон и мю-закон.
+
+190
+00:13:51,287 --> 00:13:54,674
+Эти форматы кодируют примерно 14 битный динамический диапазон в восемь бит,
+
+191
+00:13:54,674 --> 00:13:59,226
+раздвигая более высокие значения амплитуды дальше друго от друга.
+
+192
+00:13:59,226 --> 00:14:03,557
+А-закон и мю-закон, очевидно, улучшают шум квантования в сравнении с линейным 8-битным,
+
+193
+00:14:03,557 --> 00:14:08,248
+а голосовые гармоники хорошо скрывают оставшийся шум квантования.
+
+194
+00:14:08,248 --> 00:14:13,328
+Все три восьмибитные кодировки - линейная, А-закон и мю-закон, обычно используются
+
+195
+00:14:13,328 --> 00:14:18,491
+вместо с частотой дискретизации 8 кГц, хотя я демонстрирую их на 48 кГц.
+
+196
+00:14:18,491 --> 00:14:23,858
+Большинсто современных ИКМ использует знаковые целые 16 или 24 бит с дополнением до двух для кодирования
+
+197
+00:14:23,858 --> 00:14:27,800
+диапазона от минус бесконечности до нуля децибел с точностью 16 или 24 бита.
+
+198
+00:14:27,800 --> 00:14:31,584
+Максимальное абсолютное значение соответствует нулю децибел.
+
+199
+00:14:31,584 --> 00:14:35,619
+Как и во всех форматах дискретизации на данный момент, сигналы выше нуля децибел
+
+200
+00:14:35,619 --> 00:14:41,199
+и, таким образом, запределами представимого диапазона, обрезаются.
+
+201
+00:14:41,199 --> 00:14:47,222
+В микшировании и сведении не является редкостью использование чисел с плавающей точкой для ИКМ вместо целых чисел.
+
+202
+00:14:47,222 --> 00:14:52,793
+32-битное число с плавающей точкой, обыкновенная разновидность плавающей точки на современных компьютерах,
+
+203
+00:14:52,793 --> 00:14:57,040
+представляе 24 бит для разрешения, а семь бит плавающей экспоненты увеличивает передаваемый диапазон.
+
+204
+00:14:57,040 --> 00:15:00,547
+В числах с плавающей точкой, ноль децибел обычно представляется как +/-1.0,
+
+205
+00:15:00,547 --> 00:15:05,220
+и, поскольку они могут, очевидно, представлять диапазон значительно выше этого,
+
+206
+00:15:05,220 --> 00:15:11,077
+временно превышение нуля децибез в процессе смешивание не приводит к обрезани.
+
+207
+00:15:11,077 --> 00:15:15,796
+ИКМ с плавающей точкой занимает больше объема, поэтому она, как правило, используется только в качестве промежуточного производственного формата.
+
+208
+00:15:15,796 --> 00:15:18,489
+Наконец, большинсто компьютеров общего назначеня по-прежнему читают и пишут данные восьмиразрядными байтами,
+
+209
+00:15:18,489 --> 00:15:22,838
+потому важно помнить, что семплы больше восьми бит
+
+210
+00:15:22,838 --> 00:15:28,751
+могут быть в порядке big или little endian, и оба порядка распространены.
+
+211
+00:15:28,751 --> 00:15:30,139
+Например, файлы Microsoft WAV - в little endian, а Aplle AIFC - как правило в big-endian.
+
+212
+00:15:30,870 --> 00:15:34,071
+Имейте это в виду.
+
+213
+00:15:34,071 --> 00:15:38,485
+Третий параметр ИКМ - это число каналов.
+
+214
+00:15:38,485 --> 00:15:43,398
+Соглашением в сыром ИКМ является кодирование множества каналов, чередуя семплы каждого
+
+215
+00:15:43,398 --> 00:15:47,701
+канала вместе в едином потоке. Просто и расширяемо.
+
+216
+00:15:47,701 --> 00:15:51,578
+Вот и все. Это описывает все возможные представления ИКМ.
+
+217
+00:15:51,578 --> 00:15:56,436
+Готово. Цифровое аудио _настолько просто_!
+
+218
+00:15:56,436 --> 00:15:58,092
+Конечно, есть ещё много чего, но на данный момент у нас есть хороший полезный кусок аудиоданных,
+
+219
+00:16:02,571 --> 00:16:08,798
+давайте добудем также немного видео.
+
+220
+00:16:08,798 --> 00:16:12,787
+Можно рассматривать видео как аудио, только с двумя пространственными измерениями, X и Y,
+
+221
+00:16:12,787 --> 00:16:19,097
+в дополнение к измерению времени. Математически, это звук.
+
+222
+00:16:19,097 --> 00:16:25,815
+Теорема отсчетов применима ко всем трем измерениям видео точно также, как и к одному измерению времени в аудио.
+
+223
+00:16:25,815 --> 00:16:29,294
+Очевидно, на практике аудио и видео немного различны. С одной стороны, в сравнении с аудио, видео огромно.
+
+224
+00:16:29,294 --> 00:16:33,958
+Несжатое CD-аудио - это примерно 1,4 мегабита в секунду.
+
+225
+00:16:33,958 --> 00:16:40,056
+Несжатое видео 1080i HD - более 700 мегабит в секунду.
+
+226
+00:16:40,056 --> 00:16:43,711
+Приходится захватывать, обрабатывать и сохранять более, чем в 500 раз больше данных в одну секунду.
+
+227
+00:16:43,711 --> 00:16:47,838
+По закону Мура... выходит... давайте посмотрим... примерно восемь удвоений раз в два года,
+
+228
+00:16:47,838 --> 00:16:51,252
+так что да, компьютеры требуют около пятнадцати дополнительных лет для овладения несжатым видео
+
+229
+00:16:51,252 --> 00:16:55,425
+после укрощения несжатого аудио.
+
+230
+00:16:55,425 --> 00:16:58,599
+Основы сырого видео также несколько сложнее, чем основы сырого аудио.
+
+231
+00:16:58,599 --> 00:17:02,106
+Большой объем данных в настоящее время требуется представления
+
+232
+00:17:02,106 --> 00:17:06,705
+более эффективного, чем линейная ИКМ, используемая в аудио.
+
+233
+00:17:06,705 --> 00:17:13,423
+к тому же, электронное видео идет практически полностью из одного телевизионного вещания,
+
+234
+00:17:13,423 --> 00:17:17,559
+а комитеты по стандартам, которые регулируют телевещание всегда были очень озабочены обратной совместимостью.
+
+235
+00:17:17,559 --> 00:17:21,038
+До самых последних лет в США старый, шестидесятилетний черно-белый телевизор
+
+236
+00:17:21,038 --> 00:17:23,879
+мог по-прежнему показывать обычные аналоговые телевизионные передачи.
+
+237
+00:17:23,879 --> 00:17:28,718
+На самом деле это действительно искусный трюк.
+
+238
+00:17:28,718 --> 00:17:30,985
+Недостатком обратной совсемтимости является то, что если когда-то что-то попадает в стандарт,
+
+239
+00:17:30,985 --> 00:17:37,305
+вы не сможете больше никогда на самом деле выкинуть его.
+
+240
+00:17:37,305 --> 00:17:43,958
+Электронное видео никогда не начиналось с нуля, как это было неоднократно с аудио.
+
+241
+00:17:43,958 --> 00:17:50,102
+Шестьдесят лет стоят умных но устаревших хаков, необходимых в связи с уходом технологии данной эпохи,
+
+242
+00:17:50,102 --> 00:17:54,664
+образующих на самом деле нагромождение, а поскольку цифровые стандарты также пришли с телевидения,
+
+243
+00:17:54,664 --> 00:18:00,022
+все эти жутки хаки были перенесены также и в цифровые стандарты.
+
+244
+00:18:00,022 --> 00:18:05,592
+Вкратце, в цифровом видео замешано намного больше деталей, чем в аудио.
+
+245
+00:18:06,036 --> 00:18:10,857
+Нет надежды охватить здесь их все полностью, поэтому мы широко охватим основы.
+
+246
+00:18:10,857 --> 00:18:15,882
+Наиболее очевидными параметрами сырого видео являются ширина и высота изображения в пикселях.
+
+247
+00:18:15,882 --> 00:18:22,016
+Так же просто, как это может показаться, разрешение в пикселях само по себе на самом деле не определяет абсолютные
+
+248
+00:18:22,016 --> 00:18:25,005
+ширину и высоту изображения, поскольку большинство видео, происходящего из телевещания не использует квадратные пискели.
+
+249
+00:18:25,005 --> 00:18:29,021
+Число растровых строк в трянсляционном изображении было фиксированным,
+
+250
+00:18:29,021 --> 00:18:31,945
+но действительное количество горизонтальных пискелей зависело от ширины канала.
+
+251
+00:18:31,945 --> 00:18:35,489
+Действвительное горизонтальное разрешение могло приводить к тому, что пикселы
+
+252
+00:18:35,489 --> 00:18:38,395
+были либо уже, либо шире, чем интервал между строками.
+
+253
+00:18:38,395 --> 00:18:41,902
+Стандарты в основном указывают, что оцифрованное видео
+
+254
+00:18:41,902 --> 00:18:45,566
+должно отражать реальное разрешение оригинального аналогового источника,
+
+255
+00:18:45,566 --> 00:18:49,924
+поэтому большое количество цифрового видео также использует неквадратные пиксели.
+
+256
+00:18:49,924 --> 00:18:55,374
+Например, обычное NTSC DVD с соотношением 4:3 обычно кодируется
+
+257
+00:18:55,374 --> 00:18:59,640
+с разрешением экрана 704 на 408, соотношение, более широкое, чем 4:3.
+
+258
+00:18:59,640 --> 00:19:04,553
+В данном случае сами пиксели получают соотношение 10:11,
+
+259
+00:19:04,553 --> 00:19:09,800
+что делает их выше собственной ширины и сужает изображение горизонтально до
+
+260
+00:19:10,253 --> 00:19:15,287
+правильного соотношения.
+
+261
+00:19:15,287 --> 00:19:19,655
+Такое изображение толжно проходить ресемплинг для корректного отображения на дисплеях с квадратными пикселями.
+
+262
+00:19:19,655 --> 00:19:23,689
+Второй очевидный параметр видео - это частота смены кадров, количество полных кадров в секунду.
+
+263
+00:19:23,689 --> 00:19:27,113
+Активно используются несколько стандартных частот кадров. Цифровое видео, в той или иной форме,
+
+264
+00:19:27,113 --> 00:19:32,998
+может использовать их все. Или, другую частоту кадров. Или даже переменнные частоты,
+
+265
+00:19:32,998 --> 00:19:37,967
+когда частота кадров адаптивно меняется по ходу видео.
+
+266
+00:19:37,967 --> 00:19:42,075
+Чем выше частота кадров, тем более плавны движения, и это приводит нас, к сожалению, к интерлейсингу.
+
+267
+00:19:42,075 --> 00:19:45,277
+В самые ранние дни трансляции видео, инженеры искали наивысшую практическую частоту кадров
+
+268
+00:19:45,277 --> 00:19:48,182
+для гладкого движения и с минимальным мерцанием на фосфорных ЭЛТ.
+
+269
+00:19:48,182 --> 00:19:51,208
+Им было необходимо использоваить минимальную ширину полосу
+
+270
+00:19:51,208 --> 00:19:54,826
+для достижения максимального разрешения и наивысшей частоты кадров.
+
+271
+00:19:54,826 --> 00:19:59,961
+Их решением было "сплетать" видео, когда четные линии отправляются
+
+272
+00:19:59,961 --> 00:20:05,319
+в один проход и нечетные - в следующий.
+
+273
+00:20:05,319 --> 00:20:10,797
+Каждый проход называется полем, а два поля как бы образуют законченный кадр.
+
+274
+00:20:10,797 --> 00:20:15,386
+"Как бы" - потому что четные и нечетные поля на самом деле не принадлежат одному исходному кадру.
+
+275
+00:20:15,386 --> 00:20:20,272
+В изображении с 60 полями в секунду исходная частота кадров соответствует 60 полным кадрам в секунду,
+
+276
+00:20:20,272 --> 00:20:23,039
+а половина каждого кадра, каждая лишняя линия, просто отрбасывается.
+
+277
+00:20:24,047 --> 00:20:29,683
+Вот почему мы не можем применить деинтерлейсинг к видео простым комбинированием двух полей в один кадр;
+
+278
+00:20:29,683 --> 00:20:32,949
+на самом деле они не из одного и того же кадра.
+
+279
+00:20:32,949 --> 00:20:36,585
+Электронно-лучевая трубка была единственной доступной технологией отображения на протяжении больше части истории электронного видео.
+
+280
+00:20:36,585 --> 00:20:43,821
+Выходная яркость ЭЛТ нелинейна, приблизительно равняется
+
+281
+00:20:43,821 --> 00:20:50,493
+входному управляющему напряжению, возведённому в степень 2,5.
+
+282
+00:20:51,270 --> 00:20:56,637
+Эта степень, 2,5 - назначенная гамма, и поэтому она часто обозначается как гамма дисплея.
+
+283
+00:20:56,637 --> 00:21:01,634
+Камеры, напротив, являются линейными, и если вы передадите ЭЛТ линейный входной сигнал, это будет выглядить
+
+284
+00:21:01,634 --> 00:21:08,222
+следующим образом.
+
+285
+00:21:08,222 --> 00:21:13,062
+Поскольку первоначально было очень мало камер, которые были фантастически дорогими,
+
+286
+00:21:13,062 --> 00:21:18,271
+и предполагалось много, много телевизирово, которые должны быть как можно более недорогими,
+
+287
+00:21:18,271 --> 00:21:23,305
+инженеры решили добавить необходимую схему гамма-коррекции в камеры, а не телевизоры.
+
+288
+00:21:23,777 --> 00:21:25,118
+Видое, переданное по радиоволнам, таким образом, должно иметь нелинейную интенсивность, используя
+
+289
+00:21:30,393 --> 00:21:33,113
+обратную степень гаммы телевизора, потому как только сигнал с камеры, наконец, отображен на ЭЛТ,
+
+290
+00:21:33,113 --> 00:21:40,442
+общий ответ ответ системы камера-телевизор вность становится линейным.
+
+291
+00:21:40,442 --> 00:21:43,754
+Почти.
+
+292
+00:21:43,754 --> 00:21:48,279
+Также были ещё две настройки.
+
+293
+00:21:48,279 --> 00:21:52,360
+Телекамера на самом деле использует экспоненту гаммы, обратную 2,2, а не 2,5.
+
+294
+00:21:54,941 --> 00:21:57,347
+Это просто коррекция для просмотра в темном окружении.
+
+295
+00:21:57,347 --> 00:22:02,214
+Кроме того, экспоненциальная кривая переходит в линейных закон около черного.
+
+296
+00:22:02,214 --> 00:22:05,962
+Это просто старый хак для подавления шума датчика в камере.
+
+297
+00:22:05,962 --> 00:22:10,607
+Гамма-коррекция также имела удачную выгоду.
+
+298
+00:22:10,607 --> 00:22:14,336
+По воле случая, человеческий глаз имеет гамму восприятия около 3.
+
+299
+00:22:14,336 --> 00:22:18,222
+Это относительно близко к гамме ЭЛТ, 2,5.
+
+300
+00:22:18,222 --> 00:22:22,784
+Изображение, использующее гамма-коррекцию уделяет больше разрешения низким интенсивностям,
+
+301
+00:22:22,784 --> 00:22:28,419
+где, как оказалось, у глаза наилучшая различимость,
+
+302
+00:22:28,419 --> 00:22:32,491
+а следовательно, использует имеющееся разрешение более эффективно.
+
+303
+00:22:32,491 --> 00:22:36,636
+Хотя в настоящее время ЭЛТ исчезают, стандартный дисплей компьютера sRGB
+
+304
+00:22:37,580 --> 00:22:41,790
+по-прежнему использует нелинейную кривую интенсивности, схожую с телевизионной, с линейным законом в области черного,
+
+305
+00:22:41,790 --> 00:22:47,407
+с экспоненциальной кривой со значением гаммы 2,4.
+
+306
+00:22:49,258 --> 00:22:54,190
+Это кодирует шестнадцатибитный линейный диапазон в восьми битах.
+
+307
+00:22:54,190 --> 00:22:59,381
+В человеческом глазу есть три раздельных цветовых канала - красный, зеленый и синий,
+
+308
+00:22:59,381 --> 00:23:05,682
+и большинство дислпеев использует эти три цвета как компоненты смешивания, чтобы получить полный спектр цветов.
+
+309
+00:23:05,682 --> 00:23:10,919
+В печати, по той же причине, основными пигментами являются голубой (Cyan), пурпурный (Magenta) и Желтый (Yellow);
+
+310
+00:23:10,919 --> 00:23:17,211
+пигменты являются вычитаемыми, и каждый из этих пигментов вычитает один чистый цвет из отраженного света.
+
+311
+00:23:17,211 --> 00:23:21,329
+Голубой вычитает красный, пурпурный вычитает зеленый, а желтный вычитает синий.
+
+312
+00:23:21,329 --> 00:23:25,326
+Видео может, и иногда бывает, представлено красным, зеленым и синим каналами,
+
+313
+00:23:25,326 --> 00:23:28,769
+но RGB-видео нетипично. Человеческий глаз намного более чувствителен к яркости, нежели к её цвету,
+
+314
+00:23:28,769 --> 00:23:32,063
+а RGB стремится распределять энергию на изображение равномерно по всем трем каналам.
+
+315
+00:23:32,063 --> 00:23:35,705
+Посмотрите, красная красная плоскость выглядит как красная версия оригинально изображения,
+
+316
+00:23:35,706 --> 00:23:39,438
+зеленая плоскость выглядит как зеленая версия оригинального изображения,
+
+317
+00:23:39,438 --> 00:23:45,017
+а синяя плоскость выглядит как синяя версия оригинально изображения.
+
+318
+00:23:45,017 --> 00:23:51,041
+Черно-белый в тройном объеме. Неэффективно.
+
+319
+00:23:51,041 --> 00:23:57,074
+По этой причине и потому, что телевидение изначально все равно было чернобелым,
+
+320
+00:23:57,074 --> 00:24:01,867
+видео обычно представляется как канал яркости высокого разрешения,
+
+321
+00:24:01,867 --> 00:24:04,070
+черно-белый, весте с дополнительными, зачастую с меньшим разрешением, каналамии цвета.
+
+322
+00:24:04,070 --> 00:24:11,750
+Канал яркости, Y, получают взвешиванием, а затем сложением отдельных, красного, зеленого и синего сигналов.
+
+323
+00:24:11,750 --> 00:24:15,238
+Каналы насыщенности (цвета) U и V потом получают вычитанием сигнала яркости из синего,
+
+324
+00:24:15,238 --> 00:24:18,301
+и красного.
+
+325
+00:24:18,912 --> 00:24:22,983
+Когда YUV масштабируется, смещается и дискретизируется для цифрового видео, его на самом деле правильнее называть Y'CbCr,
+
+326
+00:24:22,983 --> 00:24:28,674
+но больее общий термин YUV широко распространен для описания
+
+327
+00:24:28,674 --> 00:24:34,346
+всех аналоговых и цифровых вариантов данной цветовой модели.
+
+328
+00:24:34,346 --> 00:24:39,528
+Цветовые каналы U и V могут быть того же разрешения, что и канал Y,
+
+329
+00:24:39,528 --> 00:24:43,942
+но поскольку человеческий глаз имеет куда худшее пространственное цветовое разрешение, нежели пространственное разрешение яркости,
+
+330
+00:24:43,942 --> 00:24:46,875
+разрешение насыщенности обычно берется половиной или даже четвертью в горизонтальном направлении, вертикальном,
+
+331
+00:24:46,875 --> 00:24:51,187
+или обоих, обычно без какого-либо существенного воздействия на качество видимого изображения.
+
+332
+00:24:51,187 --> 00:24:56,711
+Практически любой возможный вариант субдискретизации был использован в то или иное время,
+
+333
+00:24:56,711 --> 00:25:02,587
+но сегодня распространенными являются
+
+334
+00:25:02,587 --> 00:25:08,897
+4:4:4, который, в действительности вообще не субдискретизируется,
+
+335
+00:25:08,897 --> 00:25:17,096
+4:2:2, в котором горизонтальное разрешение каналов U и V делится пополам,
+
+336
+00:25:17,096 --> 00:25:21,186
+и наиболее общепринятый из всех, 4:2:0, при котором и горизонтальное и вертикальное разрешения
+
+337
+00:25:21,096 --> 00:25:24,776
+каналов насыщенности делятся пополам, что приводит к тому, что каждая из плоскостей U и V в четыре раза меньше Y.
+
+338
+00:25:24,776 --> 00:25:32,502
+Термины 4:2:2, 4:2:0, 4:1:1 и т.д., и т.п. не являются полными описаниями субдискретизации насыщенности.
+
+339
+00:25:32,502 --> 00:25:38,137
+Существует несколько возможных способов позиционирования пикселей насыщенности отностиельно светимых,
+
+340
+00:25:38,498 --> 00:25:43,023
+и опять, есть несколько активно используемых для каждой субдискретизации.
+
+341
+00:25:43,023 --> 00:25:46,345
+Например, motion JPEG, MPEG-1 video, MPEG-2 video, DV, Theora и WebM, все используют
+
+342
+00:25:46,345 --> 00:25:51,989
+или могут использовать субдискретизацию 4:2:0, но они располагают цветовые пикселы тремя разными способами.
+
+343
+00:25:51,989 --> 00:25:57,106
+горизонтально и вертикально между пикселями яркости.
+
+344
+00:25:57,106 --> 00:26:00,909
+Режимы с интерлейсингом несколько все усложняют, размещая их немного странно.
+
+345
+00:26:00,909 --> 00:26:04,398
+И наконец, PAL-DV, который всегда использует интерлейсинг, размещает пиксели насыщенности
+
+346
+00:26:04,398 --> 00:26:07,303
+в горизонтальном направлении в том же положении, что и пиксели яркости,
+
+347
+00:26:07,683 --> 00:26:12,282
+а вертикально чередует канал насыщенности в каждой линии.
+
+348
+00:26:12,282 --> 00:26:14,882
+И это все - только видео 4:2:0. Я оставлю остальные варианты субдискретизации как домашнее задание зрителю.
+
+349
+00:26:15,511 --> 00:26:21,128
+У вас есть основная идея, двигайтесь дальше.
+
+350
+00:26:21,128 --> 00:26:26,383
+В аудио мы обычно представляем несколько каналов в потоке ИКМ, чередуя по порядку
+
+351
+00:26:26,383 --> 00:26:30,584
+семплы каждого канала. Видео искользует как запакованные форматы, которые переплетают цветовые каналы,
+
+352
+00:26:30,584 --> 00:26:35,415
+так и плоские форматы, которые хранят пикселы из каждого канала вместе в отдельных плоскостях,
+
+353
+00:26:35,415 --> 00:26:41,549
+сложеных по порядку в кадре. Существуют как минимум 50 различных форматов в этих двух больших категориях,
+
+354
+00:26:41,549 --> 00:26:46,574
+возможно десять или пятнадцать из которых широко используются. Каждая субдискретизация насыщенности и
+
+355
+00:26:46,574 --> 00:26:50,858
+раздная битность требуют разного порядка упаковки, а потому и разного формата пикселей. Для каждой уникальной субдискретизации
+
+356
+00:26:50,858 --> 00:26:55,966
+обычно также существует несколько эквивалентных форматов, состоящих из тривиальных перестановок или перепаковок
+
+357
+00:26:55,966 --> 00:27:00,352
+порядка каналов, связанных или с удобством на определённом аппаратном обеспечении в каком-то случае
+
+358
+00:27:00,352 --> 00:27:04,692
+или, иногда, со старой доброй завистью.
+
+359
+00:27:04,692 --> 00:27:08,115
+Пиксельные форматы описываются уникальным названием четырехсимвольного кода (FourCC).
+
+360
+00:27:08,115 --> 00:27:13,704
+Их существует довольно много, и нет смысла сейчас приводить их все.
+
+361
+00:27:13,704 --> 00:27:20,339
+и субдискретизации насыщенности, но в общем случае не говорят ничего конкретного о размещении пикселей насыщенности или пространстве цветов.
+
+362
+00:27:20,339 --> 00:27:25,807
+Для примера, YV12 video может использовать размещение JPEG, MPEG-2 или DV,
+
+363
+00:27:25,807 --> 00:27:28,991
+а также любой из нескольких определений пространств цвета YUV.
+
+364
+00:27:29,472 --> 00:27:33,913
+Это завершает наше не столь быстрое и ещё не совсем законченное путешествие в сырое видео.
+
+365
+00:27:33,913 --> 00:27:38,651
+Хорошие новости в том, что мы уже можем выполнить достаточно много настоящей работы, используя данный обзор.
+
+366
+00:27:38,651 --> 00:27:42,528
+Во множестве ситуаций, кадр видеоданных является кадром видеоданных.
+
+367
+00:27:42,528 --> 00:27:46,451
+Детали приобретают значение, когда приходит время писать программы,
+
+368
+00:27:46,452 --> 00:27:52,086
+а сейчас я удовлетворен тем, что уважаемый зритель широко осведомлен в соответствующих вопросах.
+
+369
+00:27:55,640 --> 00:27:59,230
+Итак. У нас есть ауидоданные. У нас есть видеоданные.
+
+370
+00:27:59,230 --> 00:28:03,246
+Что осталось - так более знакомые не-сигнальные данные и непосредственное проектирование
+
+371
+00:28:03,246 --> 00:28:07,410
+программного обеспечения, используемого разработчиками. И многое из этого!
+
+372
+00:28:07,928 --> 00:28:11,768
+Цепочки данных сырого аудио или видео не имеют внешней видимой структуры,
+
+373
+00:28:11,768 --> 00:28:15,173
+но они часто имеют одинаковый размер. Мы можем просто выстроить их вместе
+
+374
+00:28:15,173 --> 00:28:18,097
+в жестком предопределенном порядке для стриминга или хранения,
+
+375
+00:28:18,097 --> 00:28:21,040
+и многие простые системы делают примерно то же самое.
+
+376
+00:28:21,040 --> 00:28:24,195
+С другой стороны, сжатые кадры не обязательно имеют предсказуемый рамзер,
+
+377
+00:28:24,195 --> 00:28:29,405
+и нам часто может требоваться некоторая гибкость в использовании данных ряда различных типов в потоках.
+
+378
+00:28:29,405 --> 00:28:34,281
+Если мы расположим произвольные бесформенные данные вместе, мы потеряем границы, разделяющие кадры
+
+379
+00:28:34,281 --> 00:28:37,871
+и не сможем при необходимости узнать, какие данные к какому потоку относятся.
+
+380
+00:28:37,871 --> 00:28:42,192
+Потоку необходима некоторая обобщенная структура, чтобы он был полезен.
+
+381
+00:28:42,192 --> 00:28:46,606
+В дополнение к нашим сигнальным данным, у нас также есть наши параметры ИКМ и видео.
+
+382
+00:28:46,606 --> 00:28:49,752
+Также существует множество других метаданных, с которыми мы также хотим работать,
+
+383
+00:28:49,752 --> 00:28:55,415
+такиих как аудио теги и главы видео, субтитры, все естественные компоненты rich media.
+
+384
+00:28:55,415 --> 00:29:01,633
+Имеет смысл располагать этим метаданные, другими словами данные о данных, внутри самого носителя.
+
+385
+00:29:01,633 --> 00:29:06,445
+Хранение и структурирование бесформенных данных и разнородных метаданных - это работа контейнера.
+
+386
+00:29:06,445 --> 00:29:09,221
+Контейнеры предоставляют структурирование blob'ов данных,
+
+387
+00:29:09,221 --> 00:29:12,015
+чередование и идентификацию множества потоков данных,
+
+388
+00:29:12,015 --> 00:29:15,337
+предоставляют инфомрацию синхроницаии и хранят метаданные, необходимые
+
+389
+00:29:15,337 --> 00:29:19,140
+для разбора, навигации, управления и представления данных
+
+390
+00:29:19,140 --> 00:29:22,222
+В общем, любой контейнер может содержать любой вид данных.
+
+391
+00:29:22,222 --> 00:29:24,970
+И данные могут размещаться в любом контейнере.
+
+392
+00:29:28,801 --> 00:29:32,391
+За последние тридцать минут мы охватили цифровое аудио и видео,
+
+393
+00:29:32,391 --> 00:29:35,435
+немного истории и математики и немного проектирования.
+
+394
+00:29:35,435 --> 00:29:39,377
+Мы только начали, но пришло время для заслуженного перерыва.
+
+395
+00:29:41,107 --> 00:29:45,373
+Есть ещё так много, о чем поговорить, поэтому я надеюсь, что вы присоединитесь ко мне снова в нашем следующем эпизоде.
+
+396
+00:29:45,373 --> 00:29:47,159
+До тех пор--- Пока!
+
Modified: websites/xiph.org/video/vid1.shtml
===================================================================
--- websites/xiph.org/video/vid1.shtml 2010-10-03 22:49:42 UTC (rev 17481)
+++ websites/xiph.org/video/vid1.shtml 2010-10-04 14:34:49 UTC (rev 17482)
@@ -127,6 +127,8 @@
Subtitles: US English</option>
<option file="vid1-fr.srt">
Subtitles: Français</option>
+ <option file="vid1-ru.srt">
+ Subtitles: Русский</option>
</select>
</div>
@@ -241,7 +243,9 @@
<a href="vid1-en.srt">
US English</a> |
<a href="vid1-fr.srt">
- Français</a>
+ Français</a>
+ <a href="vid1-ru.srt">
+ Русский</a>
</ul>
<p>We welcome good, technical translations from the community!
Please submit translations in SRT or Ogg Kate format
More information about the commits
mailing list