Лемер Д. - Нечеткое сопоставление данных в SQL [2024, PDF, RUS]

Reply to topic
DL-List and Torrent activity
Size:  20 MB   |    Registered:  7 months 3 days   |    Completed:  3 times
Seeders:  891  [  0 KB/s  ]   Leechers:  15  [  0 KB/s  ]   Show peers in full details
 
   
 
 
Author Message

Microsoft SQL Server ®

Gender: Male

Longevity: 9 years

Posts: 677

Post 20-Jul-2024 16:45

[Quote]

Нечеткое сопоставление данных в SQL
Год издания: 2024
Автор: Лемер Д.
Издательство: Спринт Бук
ISBN: 978-601-08-4037-9
Язык: Русский
Формат: PDF
Качество: Отсканированные страницы + слой распознанного текста
Количество страниц: 290
Описание: Если бы вам предоставили два разных, но связанных между собой набора данных, какие инструменты вы бы использовали для поиска совпадений? А если все, что у вас есть, - это доступ к базе данных через SQL SELECT? Джим Лемер предлагает лучшие практики, методики и приемы, которые помогут вам импортировать, очищать, сопоставлять, оценивать и осмысливать разнообразные данные с помощью SQL.
Администраторы баз данных, программисты, бизнес-аналитики и специалисты по исследованию данных узнают, как выявлять и удалять дубликаты, разбирать строки, извлекать данные из XML и JSON, генерировать SQL с помощью SQL, упорядочивать данные и готовить наборы данных, а также применять подходы к качеству данных и ETL для поиска сходств и различий между различными выражениями одних и тех же данных.
Примеры, приведенные в книге, полны реальных приемов и содержат рабочий код.

Примеры страниц (скриншоты)

Оглавление

От издательства ........................................................................................................ 11
О научном редакторе русского издания .............................................................. 12
П редисnовие ............................................................................................................. 13
Какие задачи мы попытаемся решить ................................................................................... 14
О чем мы будем говорить ............................................................................................................ 14
Для кого эта книга ........................................................................................................................... 17
Почему именно SQL ........................................................................................................................ 18
Осторожно! Впереди мнение! ................................................................................................... 19
Условные обозначения, используемые в книге ................................................................ 19
Другие обозначения, принятые в книге ............................................................................... 20
«Модель» данных ............................................................................................................................. 23
Использование исходного кода примеров ......................................................................... 27
Благодарности .................................................................................................................................. 27
ЧАСТЬI
ОБЗОР
Глава 1. Обзор оператора SELECT .......................................................................... 30
Простые запросы SELECT ............................................................................................................ .30
Обобщенные табличные выражения .................................................................................... .34
Случаи использования оператора CASE ............................................................................ .38
Операторы соединения .............................................................................................................. .43
И еще немного о SELECT .............................................................................................................. .53
б Оглавление
Гnава 2. Сочетание функций .................................................................................... 55
Агрегатные функции ..................................................................................................................... .56
Функции преобразования ................................... : ...................................................................... .59
Криптографические функции: HASHBYTES .......................................................................... 63
Функции даты и времени ............................................................................................................. 63
Логические функции: IIF ............................................................................................................... 66
Строковые функции ....................................................................................................................... 67
Системные функции ..................................................................................................................... .81
И еще немного о функциях ........................................................................................................ .83
ЧАСТЬ 11
СЛОЖНОСТИ ПРИ РАБОТЕ С ДАННЫМИ
Гnава 3. Имена, имена, имена ................................................................................. 86
Что в имени? ...................................................................................................................................... 86
Фамилии .............................................................................................................................................. 90
Имена .................................................................................................................................................... 98
Второе имя .......................................................................................................................................... 99
Прозвище (ник) .............................................................................................................................. 100
Название компании ..................................................................................................................... 101
Полные имена ................................................................................................................................ 102
Организации - физические лица ........................................................................................ 103
И еще немного об именах ......................................................................................................... 104
Гnава 4. Адреса, адреса, адреса ............................................................................ , 06
Из чего состоит адрес? ............................................................................................................... 1 Об
Улица и дом .................................................................................................................................... 108
Город .................................................................................................................................................. 115
Округ .................................................................................................................................................. 116
Штат или аббревиатура штата ................................................................................................ 116
Почтовый индекс, или ZIP ........................................................................................................ 117
Страна ................................................................................................................................................ 118
И еще немного об адресах ....................................................................................................... 119
Глава 5. Даты, даты, даты ...................................................................................... 121
Время относительно ................................................................................................................... 121
И еще немного о датах ............................................................................................................... 126
Глава б. Электронная почта ................................................................................... 130
Какие адреса электронной почты действительны? ..................................................... 130
И еще немного об электронной почте ............................................................................... 132
Глава 7. Телефонные номера ................................................................................ 134
Что такое телефонный номер? ............................................................................................... 134
Немного о налоговых идентификаторах ........................................................................... 140
И еще немного о телефонных номерах (и налоговых
идентификаторах) ........................................................................................................................ 141
Глава 8 . Недопустимые символы ........................................................................ 143
Представления данных .............................................................................................................. 143
Невидимые пробелы .................................................................................................................. 147
Сортировка ..................................................................................................................................... 149
Очистка входных данных .......................................................................................................... 153
И еще немного о недопустимых символах ....................................................................... 156
Глава 9. Ортоrонаnьные данные .......................................................................... 158
Общая проблема, общее решение, новая общая проблема .................................... 159
Намылить, смыть, повторить ................................................................................................... 169
И еще немного об ортогональных данных ....................................................................... 172
ЧАСТЬ 111
СБОРКА
Глава 1 О. Большой куш .......................................................................................... 176
Что нам нужно? ............................................................................................................................. 176
Настройка оценок ........................................................................................................................ 192
Удаление дубликатов .................................................................................................................. 199
И еще немного об оценке ......................................................................................................... 209
Глава 11. Качество данных, или GIGO .................................................................. 211
Как сообщить о проблеме с качеством .............................................................................. 211
Невозможные данные ................................................................................................................ 212
ETL- ваш путь к успеху ............................................................................................................ 216
И еще немного о качестве данных ....................................................................................... 221
Глава 12. Все целиком ............................................................................................ 223
Подход ............................................................................................................................................... 223
Какая оценка? ................................................................................................................................. 225
Первый проход: наивное сопоставление ......................................................................... 229
Второй проход: нормализация отношений ...................................................................... 233
Третий проход: оценка! .............................................................................................................. 238
А что с настройкой? ..................................................................................................................... 246
И напоследок о практических вопросах ........................................................................... 246
Глава 13. Код - это тоже данные! ........................................................................ 248
Работа сданными XML ............................................................................................................... 248
Работа с данными в формате JSON ....................................................................................... 250
Извлечение данных из HTML .................................................................................................. 251
Код, генерирующий код ............................................................................................................ 253
Импакт-анализ: второй пример ............................................................................................. 255
И напоследок о коде как о данных ....................................................................................... 272
И напоследок обо всем сказанном ...................................................................................... 274
Приложение. «Модель» данных ........................................................................... 276
Таблица клиентов ......................................................................................................................... 276
Представление NormalizedCustomer ................................................................................. 276
Таблица потенциальных совпадений PotentialMatches .............................................. 276
Представление CustomerCountByState ............................................................................. 280
Таблица почтовых сокращений PostalAbbreviations .................................................... 280
Глоссарий ................................................................................................................. 281
Об а вторе ................................................................................................................. 283
Иллюстрация на обложке ...................................................................................... 284
Технолоrический стек ............................................................................................ 285
[solely-soft.top].t198594.torrent
Torrent: Registered [ 2024-07-20 16:45 ] · 114BF60AD15CA76C6B01725EF4953F4F38EA5156

13 KB

Status: checked
Completed: 3 times
Size: 20 MB
Rate: 
(Vote: 0)
Have thanked: 1  Thanks   (List)
Лемер Д. - Нечеткое сопоставление данных в SQL [2024, PDF, RUS] download torrent for free and without registration
[Profile] [PM]
Forum Topic Author Size
Programming Бестселлеры O’Reilly - Лемер Мод - Масштабируемый рефакторинг. Возвращаем контроль над кодом [2022, PDF, EPUB, RUS] Programmer 11 MB
Display posts:    
Reply to topic

Current time is: 24-Feb 11:41

All times are UTC + 2



You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum
You cannot attach files in this forum
You can download files in this forum