Macromedia Flash 5 поможет реализовать все ваши идеи и профессиональное мастерство в интерактивных фильмах. Изучив возможности этой программы, вы сможете создавать уникальные Web-сайты, анимированные логотипы, используя практически весь существующий на сегодняшний день инструментарий в рабочей среде Flash 5. Внимательно прочитав эту книгу, вы будете приятно удивлены богатыми возможностями программы и усвоите основные навыки работы в ней.
Вторая часть серии статей "Использование регулярных выражений в PHP" посвящена решению ряда проблем обработки сложных текстов с помощью "продвинутых" операторов регулярных выражений.
Несмотря на то, что термины данные и информация используются взаимозаменяемо, между ними есть существенная разница. Данные существуют реально. Данные — - это список температур, перечень недавних продаж или опись товара, имеющегося в наличии. Информация — это прогнозы. Информация — это предсказание погоды, прогноз прибылей и убытков и тенденции сбыта. Данные записываются в виде нулей и единиц, в то время как информация обрабатывается мозгом.
Между данными и информацией располагается приложение: механизм, который преобразует одно в другое и наоборот. Например, при покупке книги в Интернете это приложение преобразует вашу информацию — название книги, идентификатор, информацию о банковском счете — в данные: номер заказа, цену со скидкой, характеристики транзакции с использованием кредитной карточки и количество оставшихся в наличии экземпляров книги. Аналогичным образом, приложение преобразует данные в запрос на выборку со склада, отметку об отгрузке и номер отслеживания — информацию, необходимую для реализации продажи.
В действительности сложность создания приложения прямо пропорциональна преобразованиям, которые оно выполняет. Гостевая книга Web-сайта, передающая имя и адрес в поля базы данных, устроена элементарно. С другой стороны, онлайновый магазин, который передает большое количество видов информации в модель данных коммерческой сделки и преобразует данные в информацию для реализации процесса принятия решений, достаточно сложен с точки зрения разработки. Искусство программирования заключается в умелом манипулировании данными и информацией — мастерство, схожее с фиксацией света в живописи.
Как было сказано в первой части, регулярные выражения являются одним из самых мощных средств манипулирования данными. Регулярные выражения лаконично описывают форму данных и раскладывают их на составляющие. Например, следующее регулярное выражение можно использовать для обработки температуры, заданной в градусах по Цельсию или по Фаренгейту: /^([+-]?[0-9]+)([CF])$/.
Регулярное выражение сравнивает начало строки (отображается знаком "крышка" (^), за которым идет знак "+", знак "-", или ничего ([+-]?), за которым следует целое число ([0-9]+), обозначение шкалы — Цельсия или Фаренгейта ([CF]) — и заканчивается концом строки (обозначается знаком доллара $).
В данном регулярном выражении операторы начала строки и конца строки представляют собой примеры операторов нулевой ширины или совпадений по положению, а не по символам. Круглые скобки также не указывают на символы. Зато, если заключить шаблон в круглые скобки, то будет извлечен текст, соответствующий шаблону. Следовательно, если текст полностью сопоставим с шаблоном, то первая пара круглых скобок выдаст строку, представляющую собой положительное или отрицательное целое число, например, +49, а вторая пара круглых скобок - или букву C, или F.
В первой части серии представлено понятие регулярного выражения и были описаны PHP-функции для сравнения текста с шаблонами, а также для извлечения совпадений. А теперь давайте углубимся в изучение регулярных выражений и посмотрим на некоторые "продвинутые" операторы и средства.
Круглые скобки опять приходят на помощь
В большинстве случаев пара круглых скобок используется для описания части шаблона и получения текста, соответствующего этой части. Однако от круглых скобок не всегда требуется получение части шаблона. Как и в сложной арифметической формуле, круглые скобки можно использовать для группировки условий.
Приведу пример. Догадаетесь, какому типу данных соответствует данное выражение?
/[-a-z0-9]+(?:\.[-a-z0-9]+)*\.(?:com|edu|info)/i
Как можно догадаться, это регулярное выражение определяет имена Интернет-сайтов (только для доменов .com, .edu, и .info). Отличием является использование дополнительного оператора ?:. Квалификатор части шаблона ?: отключает функцию извлечения данных, и тем самым дает круглым скобкам возможность обозначать последовательность действий. Например, в данном случае фраза (?:\.[-a-z0-9]+)* соответствует нулю или более элементам строки, например, ".ibm." Аналогично, фраза \.(?:com|edu|info) обозначает последовательность символов, за которой идет одна из строк com, edu, или info.
Отключение функции извлечения информации может показаться бессмысленным, если не подумать о том, что извлечение информации требует дополнительной обработки. Если программа обрабатывает большое количество данных, то отказ от извлечения может быть целесообразным. Кроме того, если вы имеете дело со сложным регулярным выражением, то отключение функции извлечения информации в некоторых частях шаблона может упростить извлечение тех частей шаблона, которые реально нужны.
Примечание: Модификатор i в конце регулярного выражения делает все сопоставления с шаблоном нечувствительными к регистру. Следовательно, подмножество a-z будет сопоставимо со всеми буквами, независимо от регистра.
В PHP есть и другие модификаторы частей шаблона (subpattern). Используя отладчик регулярных выражений, показанный в первой части данной серии (повторно показан в листинге 1), попробуйте сопоставить регулярное выражение ((?i)edu) со строками "EDU," "edu," и "Edu." Если в начале части шаблона задать модификатор (?i), то сопоставление с шаблоном не будет зависеть от регистра. Чувствительность к регистру восстанавливается, как только заканчивается данная часть шаблона. (Сравните с модификатором / ... /i, который применяется ко всему шаблону.)
Листинг 1. Простой отладчик регулярных выражений
Еще один полезный модификатор части шаблона - это (?x). Он позволяет добавлять в шаблон пробелы, что упрощает чтение регулярных выражений. Таким образом, часть шаблона ((?x) edu | com | info) (обратите внимание на пробелы между операторами дизъюнкции, которые добавлены для удобочитаемости) аналогична (edu|com|info). Для того, чтобы добавлять пробелы и комментарии в регулярное выражение, можно использовать глобальный модификатор / ... /x, см. листинг ниже.
Листинг 2. Добавление пробелов и комментариев
Как видно из листинга, при необходимости модификаторы можно объединять. Если необходимо включить в регулярное выражение символ пробела при использовании модификатора (?x), используйте метасимвол \s для поиска любого пробельного символа и \ (обратный слеш с пробелом) для поиска одного пробела, например, ((?x) hello \ there).
Оглядываемся вокруг
В подавляющем большинстве случаев регулярные выражения используются для проверки или декомпозиции входной информации на отдельные "лакомые кусочки", которые записываются в архив данных или сразу же обрабатываются приложением. Общепринятыми сферами применения являются: обработка полей форм, парсинг XML-кода и анализ протоколов.
Еще одна область применения регулярных выражений - форматирование, нормализация или улучшение читаемости данных. Вместо того чтобы использовать регулярные выражения для поиска и извлечения текста, при форматировании они применяются для поиска и вставки текста в надлежащее местоположение.
Вот пример полезного применения форматирования. Предположим, что Web-форма передает приложению значение зарплаты с округлением до целого доллара. Так как зарплата хранится в виде числа целого типа, то перед сохранением переданных данных приложение должно удалять из них знаки пунктуации. Однако при извлечении данных из хранилища, возможно, понадобится изменить их формат и сделать удобочитаемыми с помощью разделителей. В листинге 3 показано, как простой PHP-запрос преобразует сумму в долларах в число.
Листинг 3. Преобразование суммы в долларах в число
Вызов функции preg_replace() заменяет знак доллара, любой пробельный символ и все запятые -- на пустую строку, возвращая то, что предположительно является целым числом. Если проверка функцией is_numeric() подтверждает правильность входных данных, их можно сохранить.
А теперь давайте выполним обратную операцию - добавим к числу знак денежной единицы и запятые-разделители сотен, тысяч и миллионов. Для добавления запятых в определенных позициях можно написать программу для поиска этих компонентов, а можно воспользоваться операторами посмотри вперед и посмотри назад. Модификатор части шаблона ?<= обозначает посмотри назад (то есть влево) от текущей позиции. Модификатор ?= означает "посмотри вперед" (то есть вправо) от текущей позиции.
[pagebreak]
Итак, какие позиции нам нужны? Любое место в строке, при условии, что есть как минимум один символ слева и одна или более групп по три символа справа, не считая десятичной точки и количества центов. Соблюдая это правило и используя два модификатора, анализирующих символы справа и слева от определенной позиции и являющихся операторами нулевой ширины, мы можем достичь цели с помощью следующей инструкции:
Как работает это регулярное выражение? Начиная с первого символа строки и обрабатывая каждый символ, регулярное выражение отвечает на вопрос: "Есть ли хотя бы один символ слева и одна или несколько групп из трех символов справа?" Если да, то наш оператор нулевой ширины заменяется запятой.
Большинство сложных сопоставлений можно реализовать, используя стратегию, аналогичную приведенной выше. Например, вот еще один вариант использования оператора "посмотри вперед", который решает широко распространенную дилемму.
Листинг 4. Пример использования оператора "посмотри вперед" ("предвидение")
Оператор preg_replace() преобразует строку данных, разделенных запятыми, в строку данных, разделенных знаком табуляции. Предусмотрительным образом, он не заменяет запятые в строке, заключенной в кавычки.
Это регулярное выражение при каждом обнаружении запятой (на это указывает запятая в самом начале регулярного выражения) проверяет утверждение: "Впереди не было кавычек или было четное количество кавычек". Если утверждение верно, то запятую можно заменить знаком табуляции (the \t).
Если Вам не нравятся операторы «посмотри вперед» и «посмотри назад» или вы работаете с таким языком, в котором их нет, можно добавить запятые в число и с помощью обычного регулярного выражения. Однако для реализации такого решения потребуется много итераций.
Листинг 5. Добавление запятых
Давайте пройдем по коду. Сначала параметр зарплаты очищается от знаков пунктуации для моделирования ситуации чтения целого числа из базы данных. Затем выполняется цикл в поисках позиций, где за одним числовым символом ((\d) идут три числовых символа ((\d\d\d\): если обнаруживается граница слова, заданная как \b, цикл прекращается. Граница слова -- это еще один оператор нулевой ширины, который соответствует следующим позициям:
* Перед первым символом строки, если это буква слова.
* За последним символом строки, если это буква слова.
* Между буквой слова и небуквенным символом, непосредственно за буквой слова.
* Между небуквенным символом и буквой слова, непосредственно за небуквенным символом.
Таким образом, примерами правильных границ слова являются пробел, точка и запятая.
Благодаря внешнему циклу регулярное выражение перемещается слева направо в поисках цифры, за которой идут три цифры и граница слова. При обнаружении совпадения между двумя частями шаблона добавляется запятая. Цикл должен продолжаться до тех пор, пока оператор preg_replace() находит совпадения, что задано в условии $old != $pretty_print.
Жадность и лень
Регулярные выражения обладают большими возможностями, иногда даже слишком большими. Например, давайте рассмотрим, что произойдет, если регулярное выражение ".*" будет обрабатывать строку "The author of 'Wicked' also wrote 'Mirror, Mirror.'" Вероятно, вы предполагаете, что preg_match() вернет два совпадения, и с удивлением обнаружите, что результат всего один: 'Wicked' also wrote 'Mirror, Mirror.'
Почему? Если не задать иное, то такие операторы как * (ноль или более) и + (один или более) -- "жадные". Если сопоставление с образцом может продолжаться, то они и будут его продолжать до тех пор, пока не будет возвращен максимальный результат из возможных. Для сохранения минимальных совпадений необходимо принудительно заставлять определенные операторы быть "ленивыми". "Ленивые" операторы находят самое короткое совпадение и на этом останавливаются. Чтобы сделать оператор более "ленивым", добавьте суффикс в виде знака вопроса. Пример показан в листинге 6.
Листинг 6. Добавление суффикса в виде знака вопроса
Регулярное выражение ".*?" расшифровывается следующим образом: "найти кавычку, за которой идет ровно столько символов с последующей кавычкой.
Однако иногда оператор * может быть слишком "ленивым". Например, посмотрите на следующий фрагмент кода. Что он делает?
Листинг 7. Простой отладчик регулярных выражений
Что вы загадали? "123"? "1"? Нет результата? На самом деле результатом будет Array ( [0] => [1] => ), означающий, что совпадение было найдено, но никаких данных извлечено не было. Почему? Вспомните, что оператор * ищет совпадения с нулем или более символов. В данном случае, выражение [0-9]* находит совпадение с нулем символов от начала строки, и обработка заканчиваетс.
Для решения данной проблемы добавьте оператор нулевой ширины для привязки совпадения, который заставляет регулярное выражение продолжать сопоставления; /([0-9]*\b/.
Советы и рекомендации
С помощью регулярных выражений можно решать как простые, так и сложные задачи при обработке текста. Начните с небольшой группы операторов и по мере того, как вы будете набираться опыта, расширяйте свой словарь. В качестве вознаграждения за ваши старания -- некоторые советы и рекомендации.
Создание переносимых регулярных выражений с помощью классов символов
Вам уже знакомы метасимволы, например, \s - соответствует любому пробельному символу. Кроме того, большинство реализаций регулярных выражений поддерживает предопределенные классы символов, которые более просты в использовании и переносимы с одного письменного языка на другой. Например, класс символов [:punct:] замещает все символы пунктуации в данном языке. Вместо [0-9] можно использовать [:digit:] и более переносимое замещение [:alpha:] вместо [-a-zA-Z0-9_]. Например, можно убрать все знаки пунктуации, используя:
Класс символов представляет собой более сжатую форму по сравнению с подробным описанием всех символов пунктуации. Полный перечень классов символов можно найти в документации по версии языка PHP.
Как исключить то, что вы не ищете
Как показано в примере с данными, разделенными символом табуляции, в качестве значений, разделенных запятыми (CSV), иногда проще и точнее задать список тех вариантов, которые не нужно находить (сопоставлять). Последовательность, начинающаяся со знака "крышка" (^) будет соответствовать любому символу, не принадлежащему данной последовательности. Например, для проверки правильности телефонных номеров для США можно использовать регулярное выражение /[2-9][0-9]{2}[2-9][0-9]{2}[0-9]{4}/. Используя набор ограничений можно написать регулярное выражение в более явном виде /[^01][0-9]{2}[^01][0-9]{2}[0-9]{4}/. Оба регулярных выражения работают, хотя смысл последнего, вероятно, более понятен.
Пропуск новой строки
Если во входных данных несколько строк, стандартного регулярного выражения будет недостаточно, так как сканирование прекращается на начале новой строки, которая обозначается $. Однако, если воспользоваться модификаторами s или m, то регулярное выражение будет обрабатывать входные данные по-другому. Первый модификатор рассматривает строковую последовательность как одну строку, где точка указывает на начало новой строки (обычно она этого не делает). Второй рассматривает строковую последовательность как несколько строк, где ^ и $ соответствуют началу и концу любой строки, соответственно. Приведем пример. Если задать $string = "Hello,\nthere";, то оператор preg_match( "/.*/s", $string, $matches) параметру $matches[0] присвоит значение Hello,\nthere. (При удалении s будет выдано Hello.)
Начинающий фотограф не всегда сможет правильно определять параметры съемки и подстраиваться под те условия, которые сложились на момент съемки. Обычно мастерство приходит после большого количества проб и ошибок.
Но хороших знаний техники съемки бывает мало. Бывают фото-работы на которых, трудно найти какую-либо погрешность, а изображение кажется совершенно неудавшимся. Профессионализм фотографа - в умении видеть. Каждый снимок - это новая картина, новые чувства и переживания. И когда у фотографа появляется желание реализовать свой творческий замысел, можно считать, что он становится настоящим знатоком фото дела.
Реализация необычных идей - привычное дело для фотографа. Владея некоторыми приемами и цифровой камерой (подойдет даже фотоаппарат начального уровня), можно создать свои неповторимые работы.
Секреты цифрового объектива
Начинающий фотограф не всегда сможет правильно определять параметры съемки и подстраиваться под те условия, которые сложились на момент съемки. Обычно мастерство приходит после большого количества проб и ошибок.
Но хороших знаний техники съемки бывает мало. Бывают фото-работы на которых, трудно найти какую-либо погрешность, а изображение кажется совершенно неудавшимся. Профессионализм фотографа - в умении видеть. Каждый снимок - это новая картина, новые чувства и переживания. И когда у фотографа появляется желание реализовать свой творческий замысел, можно считать, что он становится настоящим знатоком фото дела.
Реализация необычных идей - привычное дело для фотографа. Владея некоторыми приемами и цифровой камерой (подойдет даже фотоаппарат начального уровня), можно создать свои неповторимые работы.
Как стать силачом и подержаться за солнце?
Принцип этого трюка основан на простом зрительном обмане. По мере удаления от точки съемки угловой размер объектов становится меньше, а, следовательно, и на фотографии их размер будет обманчив.
Обязательным условием положительного результата должна быть высокая глубина резкости, при которой в фокус попадали бы объекты переднего и заднего плана сцены (в противном случае, станет заметна подделка и обман откроется).
Аналогичный прием может быть использован не только на фотографии, но и при съемке видео. Такой способ может оказаться весьма кстати, когда необходимо завуалировать разницу в росте людей при групповой съемке, для выгодного представления интерьера и т.д.
Трюк с солнцем нужно обязательно делать в безоблачную погоду утром при восходе или вечером при закате светила, когда оно еще находится довольно низко над горизонтом. Человек, которого снимает фотограф, должен располагаться на открытом пространстве, на таком расстоянии, при котором его размеры будут соизмеримы с размерами солнечного диска. Следуя командам фотографа, этот человек поднимает руки на такую высоту, при которой из точки съемки будет видно солнце между руками.
Фото в воздухе.
Фотография - это отображение реального мира. Но если фотографу удастся создать снимок, на котором, с точки зрения, заснято то, чего не может быть, интерес к такой фотографии возрастет во много раз.
Все в мире подчиняется законам физики. Как же заставить зрителя поверить в то, что законы физики не действуют? Такой способ уже давно существует. Один из часто используемых приемов старого кино - полет актера в воздухе. Для того чтобы зритель поверил в то, что супермен может летать, его поднимали на специальном тонком тросе, цвет которого совпадал с цветом фона. Сливаясь с фоном, трос становился невидимым, поэтому казалось, что актер парит над землей.
Подобный прием можно использовать и в фотографии. "Подвесить" стакан воды в воздухе можно, обвязав его тонкой веревкой или леской. Подобрав освещение, можно добиться того, что леска, обтягивающая стакан, будет незаметна. Правда, скорее всего, такую фотографию придется обрезать по краям, так как на некотором расстоянии леска станет видна.
Освещение объектов такой съемки зависит от того, какой фон выбран. Светлые нити должны быть хорошо освещены для того, чтобы не оттенялись на общем фоне. Темные же нити желательно спрятать в тени.
В купальнике - на Северный Полюс!
В середине прошлого века было очень популярно фотографироваться, вставляя свое лицо в прорезь с обратной стороны огромного щита, на котором запечатлен какой-нибудь сюжет. Так фотографу удавалось сделать снимок человека на лошади, в костюме императора и т.д.
Сейчас их роль могут выполнить большие рекламные щиты, которых очень много на современных улицах. Фотографии, наклеенные на них, можно использовать для создания оригинальных трюков.
При съемке на фоне рекламного щита важно удачно выбрать ракурс, чтобы в кадр не попали рекламные надписи, а также крепления щита, которые сразу выдадут подделку.
Для исполнения этого трюка подойдут не только рекламные щиты, но и фотообои с пейзажами, а также любые другие большие снимки, которые вам удастся найти. Если же большие фотографии найти не удается, можете попробовать осуществить этот трюк и с маленькими. Правда, в этом случае в кадр вам полностью попасть не удастся, но небольшого зверька с фотографии вы погладить вполне сможете.
Невероятные фигуры.
Если нужно создать композицию для рекламы, а сам рекламируемый товар или услуга - не лучший объект для съемки, можно прибегнуть к какому-нибудь оптическому обману, что, несомненно, вызовет интерес. Размещение такой рекламы в общественном транспорте или на страницах журнала будет очень эффективно и гарантирует то, что на нее обратят внимание. Даже если человек не интересуется предметом рекламы, он будет долго смотреть на нее, пытаясь сообразить, как же это было сделано.
Использование в художественных работах зрительных иллюзий первым придумал нидерландский художник Мауриц Эшер, который жил в первой половине прошлого века. Одна из его самых известный работ, которую сможете позаимствовать для своих снимков и вы - куб Эшера. Из одного бруска вырезана середина в таком месте, через которое видно дальнее ребро куба. Благодаря этому, когда зритель смотрит на куб, ему кажется, что дальнее ребро пересекает ближнее.
Еще один трюк зрительного обмана можно сделать из трех брусков, "закрутив" их в треугольник по принципу ленты Мебиуса. Для этого нужно поставить бруски таким образом, чтобы третий располагался перпендикулярно плоскости, в которой лежат первые два. На третьем бруске должен быть срез, который поможет сымитировать замкнутую фигуру. Фотографировать такой треугольник нужно с определенной точки, при котором бруски составляют единое целое.
Игры со стеклом.
Благодаря прозрачности и свойствам отражения и преломления лучей, стеклянные объекты помогут создать множество интересных оптических эффектов. Самый известный из них - эффект каустики. Этим термином называют блики света на поверхностях, полученные вследствие прохождения света через прозрачную среду. Обычно эти блики располагаются в области тени, отбрасываемой стеклянным объектом.
Существуют и другие, менее известные, но не менее интересные приемы использования оптических свойств стекла. Один из них - "шахматный рисунок".
Создается он следующим образом. Нужно поставить перед бутылкой два бокала, заполненные жидкостью до половины. Центр этих бокалов должен совпадать с краями бутылки. Это - обязательное условие, поэтому нужно отнестись серьезно к выбору бокалов. Скорее всего, вам придется использовать два бокала разной формы - узкий и широкий. Благодаря эффекту преломления лучей изображение в части бокала, заполненной жидкостью, "перевернется". Та часть жидкости, которая в бокале закрывает бутылку, будет отражать цвет фона, а та часть, которая выходит за край бутылки окрасится в цвет бутылочного стекла. Два бокала, расположенные по краям бутылки, создадут эффект "шахматного поля".
Разместил: Игорь
Внимание! Если у вас не получилось найти нужную информацию, используйте рубрикатор или воспользуйтесь поиском