Register · · Password forgotten? · |
Лемер Д. - Нечеткое сопоставлени
|
![]() |
Home » Books and magazines » Computer literature » Database management system |
DL-List and Torrent activity | |
Size: 20 MB | Registered: 7 months 3 days | Completed: 3 times | |
|
Author | Message | |||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Microsoft SQL Server ® Gender: Longevity: 9 years Posts: 677 |
Нечеткое сопоставление данных в SQL
Год издания: 2024 Автор: Лемер Д. Издательство: Спринт Бук ISBN: 978-601-08-4037-9 Язык: Русский Формат: PDF Качество: Отсканированные страницы + слой распознанного текста Количество страниц: 290 Описание: Если бы вам предоставили два разных, но связанных между собой набора данных, какие инструменты вы бы использовали для поиска совпадений? А если все, что у вас есть, - это доступ к базе данных через SQL SELECT? Джим Лемер предлагает лучшие практики, методики и приемы, которые помогут вам импортировать, очищать, сопоставлять, оценивать и осмысливать разнообразные данные с помощью SQL. Администраторы баз данных, программисты, бизнес-аналитики и специалисты по исследованию данных узнают, как выявлять и удалять дубликаты, разбирать строки, извлекать данные из XML и JSON, генерировать SQL с помощью SQL, упорядочивать данные и готовить наборы данных, а также применять подходы к качеству данных и ETL для поиска сходств и различий между различными выражениями одних и тех же данных. Примеры, приведенные в книге, полны реальных приемов и содержат рабочий код. ОглавлениеОт издательства ........................................................................................................ 11О научном редакторе русского издания .............................................................. 12 П редисnовие ............................................................................................................. 13 Какие задачи мы попытаемся решить ................................................................................... 14 О чем мы будем говорить ............................................................................................................ 14 Для кого эта книга ........................................................................................................................... 17 Почему именно SQL ........................................................................................................................ 18 Осторожно! Впереди мнение! ................................................................................................... 19 Условные обозначения, используемые в книге ................................................................ 19 Другие обозначения, принятые в книге ............................................................................... 20 «Модель» данных ............................................................................................................................. 23 Использование исходного кода примеров ......................................................................... 27 Благодарности .................................................................................................................................. 27 ЧАСТЬI ОБЗОР Глава 1. Обзор оператора SELECT .......................................................................... 30 Простые запросы SELECT ............................................................................................................ .30 Обобщенные табличные выражения .................................................................................... .34 Случаи использования оператора CASE ............................................................................ .38 Операторы соединения .............................................................................................................. .43 И еще немного о SELECT .............................................................................................................. .53 б Оглавление Гnава 2. Сочетание функций .................................................................................... 55 Агрегатные функции ..................................................................................................................... .56 Функции преобразования ................................... : ...................................................................... .59 Криптографические функции: HASHBYTES .......................................................................... 63 Функции даты и времени ............................................................................................................. 63 Логические функции: IIF ............................................................................................................... 66 Строковые функции ....................................................................................................................... 67 Системные функции ..................................................................................................................... .81 И еще немного о функциях ........................................................................................................ .83 ЧАСТЬ 11 СЛОЖНОСТИ ПРИ РАБОТЕ С ДАННЫМИ Гnава 3. Имена, имена, имена ................................................................................. 86 Что в имени? ...................................................................................................................................... 86 Фамилии .............................................................................................................................................. 90 Имена .................................................................................................................................................... 98 Второе имя .......................................................................................................................................... 99 Прозвище (ник) .............................................................................................................................. 100 Название компании ..................................................................................................................... 101 Полные имена ................................................................................................................................ 102 Организации - физические лица ........................................................................................ 103 И еще немного об именах ......................................................................................................... 104 Гnава 4. Адреса, адреса, адреса ............................................................................ , 06 Из чего состоит адрес? ............................................................................................................... 1 Об Улица и дом .................................................................................................................................... 108 Город .................................................................................................................................................. 115 Округ .................................................................................................................................................. 116 Штат или аббревиатура штата ................................................................................................ 116 Почтовый индекс, или ZIP ........................................................................................................ 117 Страна ................................................................................................................................................ 118 И еще немного об адресах ....................................................................................................... 119 Глава 5. Даты, даты, даты ...................................................................................... 121 Время относительно ................................................................................................................... 121 И еще немного о датах ............................................................................................................... 126 Глава б. Электронная почта ................................................................................... 130 Какие адреса электронной почты действительны? ..................................................... 130 И еще немного об электронной почте ............................................................................... 132 Глава 7. Телефонные номера ................................................................................ 134 Что такое телефонный номер? ............................................................................................... 134 Немного о налоговых идентификаторах ........................................................................... 140 И еще немного о телефонных номерах (и налоговых идентификаторах) ........................................................................................................................ 141 Глава 8 . Недопустимые символы ........................................................................ 143 Представления данных .............................................................................................................. 143 Невидимые пробелы .................................................................................................................. 147 Сортировка ..................................................................................................................................... 149 Очистка входных данных .......................................................................................................... 153 И еще немного о недопустимых символах ....................................................................... 156 Глава 9. Ортоrонаnьные данные .......................................................................... 158 Общая проблема, общее решение, новая общая проблема .................................... 159 Намылить, смыть, повторить ................................................................................................... 169 И еще немного об ортогональных данных ....................................................................... 172 ЧАСТЬ 111 СБОРКА Глава 1 О. Большой куш .......................................................................................... 176 Что нам нужно? ............................................................................................................................. 176 Настройка оценок ........................................................................................................................ 192 Удаление дубликатов .................................................................................................................. 199 И еще немного об оценке ......................................................................................................... 209 Глава 11. Качество данных, или GIGO .................................................................. 211 Как сообщить о проблеме с качеством .............................................................................. 211 Невозможные данные ................................................................................................................ 212 ETL- ваш путь к успеху ............................................................................................................ 216 И еще немного о качестве данных ....................................................................................... 221 Глава 12. Все целиком ............................................................................................ 223 Подход ............................................................................................................................................... 223 Какая оценка? ................................................................................................................................. 225 Первый проход: наивное сопоставление ......................................................................... 229 Второй проход: нормализация отношений ...................................................................... 233 Третий проход: оценка! .............................................................................................................. 238 А что с настройкой? ..................................................................................................................... 246 И напоследок о практических вопросах ........................................................................... 246 Глава 13. Код - это тоже данные! ........................................................................ 248 Работа сданными XML ............................................................................................................... 248 Работа с данными в формате JSON ....................................................................................... 250 Извлечение данных из HTML .................................................................................................. 251 Код, генерирующий код ............................................................................................................ 253 Импакт-анализ: второй пример ............................................................................................. 255 И напоследок о коде как о данных ....................................................................................... 272 И напоследок обо всем сказанном ...................................................................................... 274 Приложение. «Модель» данных ........................................................................... 276 Таблица клиентов ......................................................................................................................... 276 Представление NormalizedCustomer ................................................................................. 276 Таблица потенциальных совпадений PotentialMatches .............................................. 276 Представление CustomerCountByState ............................................................................. 280 Таблица почтовых сокращений PostalAbbreviations .................................................... 280 Глоссарий ................................................................................................................. 281 Об а вторе ................................................................................................................. 283 Иллюстрация на обложке ...................................................................................... 284 Технолоrический стек ............................................................................................ 285
|
|||||||||||||||||||||
Forum | Topic | Author | Size |
---|---|---|---|
Programming | Бестселлеры O’Reilly - Лемер Мод - Масштабируем |
Programmer | 11 MB |
![]() |
Home » Books and magazines » Computer literature » Database management system |
Current time is: 24-Feb 11:41
All times are UTC + 2
You cannot post new topics in this forum
You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum You cannot attach files in this forum You can download files in this forum |