Наконец-то дошли руки и до блога. Очистил его от сотен спам-комментов, а заодно обновил плагин «Я не робот!«. За эти несколько месяцев успел узнать и попоробовать для себя много нового, интересного и неизведанного.
Очень зантересовался технологией XML. Хотя технологией это трудно назвать, так пусть будет форматом. Раньше я довольно пренебрежительно на него смотрел, но в один прекрасный момент я понял все его прелести. Во-первых, XML можно назвать форматом хранения баз данных. Да, настоящие и полноценные базы данных иерархического типа. В отличии от традиционных на сегодняшний день реляционных базах данных (MySQL и т.п.), XML формат даёт колоссальную гибкость! Допустим есть абстрактный товар, который может иметь до 50 различных характеристик разного типа. В реляционных СУБД можно пойти двумя путями: создать таблицу с 50 столбцами или создать справочник атрибутов, что более логично, но немного усложнит поиск товаров по характеристикам. А в XML всё просто! Если какой-то параметр не используется – его можно просто опустить! Или если появилась новая характеристика – не нужно редактировать структуру таблицы или добавлять новый параметр в справочник, достаточно добавить в XML файл у нужного товара нужный тег. Во-вторых, я думал что XML очень медленный, но на деле оказалось совсем не так. На первый взгляд сложные запросы обрабатывались за считанные милисекунды. Единственное что не понял в XML, как и зачем обрабатывать DTD схемы. Иначе говоря, не нашёл примеров. Буду очень рад, если покажете. Моё мнение: XML очень перспективная технология и при наличии быстрых и мощных парсеров способна стать основой для десятков тысяч сайтов.О XML можно писать бесконечно, чем я и займусь в последующих статьях.
Ознакомился с PHP фреймворком CodeIgniter и вообще с MVC подходом программирования. Как сообщает могучая Википедия, MVC это Model-view-controller (Модель-представление-поведение, Модель-представление-контроллер) — архитектура программного обеспечения, в которой модель данных приложения, пользовательский интерфейс и управляющая логика разделены на три отдельных компонента. Модификация одного из компонентов оказывает минимальное воздействие на другие компоненты. Как говорится, разделяй и властвуй. На мой взгляд, такой метод вполне способен на жизнь, но имеет свои ограничения, особенности и недостатки. В качестве фреймворка для изучения я выбрал CodeIgniter. Почему имено CI? Он стабильный, развивающийся, документированный, не слишком захламляет код и вполне гибок. Коме того гибкий алгоритм кеширования даёт вполне приемлемые результаты по производительности. Как бы небыли хороши новомодные фреймворки, CodeIgniter является одним из лидеров рынка. Как бы я не любил JavaScript фреймворк MooTools, а JQuery имеет в 100 раз больше возможносей, плагинов и т.п. Точно так же и с CodeIgniter. Моё знакомство с ним остановилось на переносе одного из проектов в его объекты, модули и контроллеры.
Наконец-то разобрался с phpMorphy. Как не сложно догадаться, phpMorphy – библиотека морфологического анализа, реализованная на платформе PHP. Раньше я использовал парсер Mystem производства Яндекса и параллельно следил за развитием phpMorphy. В один прекрасный момент сел и хорошо разобрался с этой библиотекой, сейчас использую её вместо Mystem в своих экспериметах с морфологией. Очень доволен. В качестве тренировочной работы написал небольшой синонимайзер с поддержкой морфологии, вставлюящий слова в нужных словоформах очень с большой точностью. Но такой уж русский язык, для кого великий, для кого могучий, но в плане алгоритмиции очень сложный. А если вместо синонимов загрузить в синонимайзер базу ключевиков, то получится очень интересный метод вставки ключевиков в текст. Возможно у этого метода получится заменить цепи Маркова. Но это сможет показать лишь практика.
XHE. Да, это тот самый Xedant Human Emulator. Долго искал крякнутую версию (да простят меня разработчики!), а потом случайно нашёл её у себя в залежах всяких непонятных файлов на винчестере. Видимо скачал прозапас. Меня давно заитересовало как это Xedant Human Emulator хитро управляет Internet Explorer’ом с помощью PHP. Оказалось всё просто и банально. Как же я сам до такого не догадался? Вроме того узнал о различных плагинах для FireFox, выполняющие аналогичные действия по автоматизации работы с браузером. Но большой минус всех этих плагинов – в них нет всей моoности и десятков тысяч функций языка PHP! Так что за идею разрабодчкикам Xedant Human Emulator миллион, а сама реализация, на мой взгляд, не такая уж и сложная. Попробовал писать скрипты – просто шикарно! Время разработки парсеров ументшается в разы! Раньше приходилось извращаться с CURL, даже пришлось писать собственную обёртку. А тут оказывается всё делается за считанные минуты, очень жалею что не уделял этой софтине внимания раньше, не пришлось бы писать сотни килобайт парсеров. Но дальше баловства пока дело не ушло. Если вдруг решу активно использовать данный софт – обязательно преобрету лицензию, и Вам советую!
Дорвеи. Дорвеями не занимался с лета, надоело после того как Яндекс забанил небольшую сетку. Сам виноват, оставил слишком много общих признаков. Но трафик доров с Гугла даёт несколько баксов с партнёрок и по сей день. В ближайшее время хочу испробовать свои новые наработки. Надеюсь они себя хотя бы окупят.
Так же за это время реализовал несколько белых СДЛ проектов на собственном движке для сателлитов, который в последстви или пойдёт в свободную продажу или станет основой для сайтов моей собственной дизайн-студии по разработке и продвижению сайтов. Да, идеи на счёт фирмы посещают меня всё чаще и чаще. Впринципе опыта в этой свере имеется выше крыши. Осталось только выбрать подходящий момент и начать.
Помимо этого паршу, граблю и собираю контент и базы данных другими автоматическими способами. Уже накопилось приличное количествово контента, в ближайшее время планирую выпуск нескольких тестовых серых сайтов. Так же всемя от времени дорабатываю свой анализатор апдейтов. Зачем свой? Потому что я смогу мониторить любые запросы по любым регионам а так же строить отчёты, которые нужны в данный момент.
Новые виды зароботка. Успел проанализировать несколько новых для себя способов монетизации сайтов. Один из которых размещений файлов на файлообменниках. Если конбинировать его с другими способами, то с 1 000 уников можно получить 15-20$ на развлекательном и другоми беспонтовом трафике. Буду эксперементировать и отписываться в блоге.
Sape. Не заходил туда уже полгода, т.к. завязал с продажей ссылок по причине низкой окупаемости. Но тут что-то решил зайти и обнаружил на счету целых 7 000 рублей, которые потихоньку накапали с нескольких сателлитов. Был приятно удивлён. Для тех, кто ещё не продаёт ссылки со своих сайтов, рекомендую зарегистрироваться в Sape, и получать небольшой и стабильный пассивный доход.
Так же радует Google AdSense. Время от времени капает по несколько долларов в сутки. Думаю нужно активизироваться в этом направлении.
А так же самая большая радость осени! Аллоды Онлайн перешли в стадию Открытого Бета Теста. Эта игра из моего детства, в первую чатсь я играл ешё на компьютеле с 32 Мб ОЗУ. По сути российские разработчики склонировали всем известный World of Warcraft и добавили туда берёзок, ромашек, самоваров, балалаек и баню. Но так же есть и интересные нововедения. Единственное что огорчила, геймплей стал ВоВ’овским, а не аллодовским. Но, надеюсь разработчки вернул в Аллоды все прелести. На данный момент имею 3 персонажа разных расс и специализаций 9, 10 и 14 уровня. До 40 качаться и качаться. Так что обязательно куплю лицензионное издание Аллодов онлайн за 1 500 рублей, ради такого не жалко, уже нашёл место где купить.
На этом заканчиваю свой обзор, надеюсь ничего не забыл и до скорых встречь!
XML в общем то ничего общего с базами данных не имеет, но если интересует подобный подход и гибкость, то есть объектно-ориентированные базы данных. Я об этом узнал когда раньше админил Lotus Domino, уже больше 5 лет с того времени прошло, а все равно смотрю за его развитием.
XML прежде всего язык разметки, а уж как использовать данные из него дело каждого. Суть в том, что сама структура XML файлов имеет древовидный вид, что свойственно как раз иерархическим типам баз данных. То же можно сказать и JSON. Но никто не запрещает на XML строить реляционные модели данных. Я выражусь немного иначе: XML является форматом хранения баз данных, но не является СУБД.
Кристофер Дейт отмечал, что «…XML является попыткой заново изобрести иерархические базы данных…» (в 1980-е года иерархические базы данных были вытеснены реляционными базами данных).
Насколько я понял, ООСУБД совместимых с PHP не бывает?
Нет, про такие СУБД для PHP я не слышал, да честно говоря и надобности не было
С возвращением!
Регулярно посещал все это время ваш блог и был приятно удивлен увидев новый и столь объемный и довольно интересный пост. Так держать.
Тоже давно хотел потестить Хуман, но что то денег было жалко. Сейчас вот подумываю приобрести.
Да, сам удивился, что столько написал =)
Немножко освобожусь, и хочу написать серию статей по обработке XML данных не на абстрактных примерах, а допустим, на RSS фидах и каталогах парнёрок.
Maximus_one, письмецо отправил =)
Если не секрет конечно, какой объём трафика для адсенса и тематика?
Объёмы – кот наплакал. Тема: недвижимость, строительство, мебель, драгоценности, одежда.