В книге приводятся практические приемы анализа данных. Рассказано, как исследовать и тестировать взаимосвязи между переменными в Excel и использовать его для статистики и анализа. Описан перенос данных из Excel в R, язык программирования с открытым исходным кодом, специально разработанный для выполнения статистического анализа. Отдельный раздел посвящен переносу данных из Excel в Python и выполнению полного анализа данных средствами этого языка. В результате читатель научится выполнять разведочный анализ данных (Exploratory Data Analysis, EDA) и проверку гипотез с использованием языков программирования Python и R.
Python — первоклассный инструмент, и в первую очередь благодаря наличию множества библиотек для хранения, анализа и обработки данных. Отдельные части стека Python описываются во многих источниках, но только в новом издании «Python для сложных задач» вы найдете подробное описание: IPython, NumPy, Pandas, Matplotlib, Scikit-Learn и др. Специалисты по обработке данных, знакомые с языком Python, найдут во втором издании решения таких повседневных задач, как обработка, преобразование и подготовка данных, визуализация различных типов данных, использование данных для построения статистических моделей и моделей машинного обучения. Проще говоря, эта книга является идеальным справочником по научным вычислениям в Python.
Введение в науку о данных или статистику не должно начинаться с доказательства сложных теорем или запоминания терминов и формул, но именно так устроены многие учебники по количественному анализу. В отличие от них эта книга посвящена критическому мышлению и концептуальному пониманию; она учит читателей быть вдумчивыми потребителями и аналитиками тех видов информации и аргументов, с которыми они будут сталкиваться на протяжении всей своей жизни. Книга, наполненная реальными примерами, показывает, как инструменты критического анализа применяются к проблемам в самых разных областях, включая выборы, гражданские конфликты, преступность, терроризм, финансовые кризисы, здравоохранение, спорт, музыку и космические путешествия. Прочитав эту книгу, вы узнаете, почему, несмотря на обширное применение данных в современном мире, они никогда не смогут заменить критическое мышление. В конце каждой главы есть упражнения, которые читатели могут выполнить самостоятельно, чтобы убедиться, что они усвоили материал. Некоторые из этих упражнений включают анализ данных, с ним могут справиться читатели и студенты, которые научились (или учатся) использовать статистическое рограммное обеспечение, такое как Stata или R.
В учебнике рассмотрены следующие вопросы: теория, методология и практика работы с данными, базами данных, базами знаний и хранилищами данных; модели представления данных в памяти компьютера — модель «сущность — связь»; дореляционные модели представления данных, реляционные базы данных; проектирование реляционных баз данных; направления развития баз данных; физическая организация систем управления базами данных.
Выбрав StatPlus, вы получаете универсальное решение для обработки и анализа данных с простым и понятным интерфейсом. За последние 15 лет StatPlus стала популярным инструментом статистического анализа во многих областях, в частности — в социологии, медицине и фармации, экономике и в индустрии страхования, в здравоохранении и клинических исследованиях, и даже в авиационной промышленности.
Существует большое количество инструментов для автоматической очистки компьютера, но ни один из них не способен освободить значительный объем. В первую очередь потому, что удаляются достаточно небольшие данные в системе, которые со временем появятся снова. Но есть способ ручной очистки, который освободит в разы больше места на длительный срок. Представляем вашему вниманию Files Inspector. Эта утилита работает не с системными файлами, а с вашими файлами и папками. Она позволяет наглядно увидеть, чем именно заняты носители вашего компьютера. Фотографии, документы, фильмы, музыка и многое другое. Все это можно наглядной увидеть в утилите и при необходимости удалить ненужное.
Пройдите подготовку к экзамену DA-100 и продемонстрируйте свои умения в области анализа данных и визуализации с помощью Power BI. Написанная для аналитиков данных, желающих подтвердить свой статус, эта книга фокусируется на критическом мышлении и процессе принятия решений, необходимых для успешной деятельности в роли сертифицированного специалиста.
Disk Savvy - полезный инструмент для анализа свободного и занятого пространства жесткого диска. После сканирования локального диска или же какой-либо отдельно выбранной папки, пользователь получит полную наглядную информацию о папках и файлах внутри выбранного раздела, благодаря чему можно определить, что "весит" больше всего, а что занимает совсем немного места. Такой обзор дискового пространства компьютера позволит наилучшим образом оптимизировать размещение файлов и папок на разных разделах для максимального удобства и продуктивности.
Рассказывается о возможностях SQL применительно к анализу данных. Сравниваются различные типы баз данных, описаны методы подготовки данных для анализа. Рассказано о типах данных, структуре SQL-запросов, профилировнии, структурировании и очистке данных. Описаны методы анализа временных рядов, трендов, приведены примеры анализа данных с учетом сезонности. Отдельные главы посвящены когортному анализу, текстовому анализу, выявлению и обработке аномалий, анализу результатов экспериментов и А/В-тестирования.
Эта книга станет вашим проводником в мир моделирования данных в целом и применительно к Power BI. Вы узнаете, как подключаться к данным в различных источниках, объединять их при помощи связей и строить полноценные модели данных, изучите вопросы определения новых метрик и выполнения пользовательских вычислений с использованием особенностей модели. По мере чтения сложность и эффективность моделей данных будет увеличиваться. Вы научитесь использовать язык запросов DAX, а также новые техники моделирования. На конкретных примерах будет показано, как создавать новые или адаптировать существующие модели данных с учетом разнообразных бизнес-требований. Вы ознакомитесь с продвинутыми возможностями оптимизации и расширения своих моделей данных для решения широкого спектра задач. Книга предназначена для пользователей систем бизнес-аналитики, а также специалистов и разработчиков в области анализа данных, желающих в полной мере освоить техники моделирования данных при помощи Power BI. Желательно наличие базовых знаний в области Power BI и понимание схемы данных «звезда».
Wireless Password Recovery - утилита для анализа безопасности беспроводных сетей и восстановления паролей WPA/WPA2. Wireless Password Recovery является единственным программным решением, применяющим самые современные технологии восстановления паролей, разработанные программистами нашей компании.
Device Monitoring Studio - это программное решение для мониторинга, регистрации и анализа данных, поступающих через порты и соединения ПК.
Device Monitoring Studio - это программное решение для мониторинга, регистрации и анализа данных, поступающих через порты и соединения ПК.
В этой книге на конкретных примерах рассматриваются все типы оконных функций: агрегатные, ранжирующие, статистические, а также функции смещения и функции упорядоченного набора. Вы узнаете, как использовать оконные функции для повышения эффективности запросов, которые раньше писали с применением предикатов, освоить концепцию работы с окнами в SQL и строить запросы наиболее эффективным образом, умело использовать опции секционирования, упорядочивания и определения границ окна, оптимизировать оконные функции с использованием индексов и пакетного режима, применять оконные функции для решения распространенных бизнес-задач. Издание предназначено для разработчиков, администраторов, специалистов в области бизнес-аналитики. Актуально для SQL Server 2019 и ниже, а также для Azure SQL Database.
Если вам необходима статистическая обработка данных для курсовой, диплома, статьи или диссертации; вы хотите лучше понимать результаты тех статистических методов, которые применяете; вы устали от того, что программы анализа данных не способны выполнить нестандартные задачи; вам необходимо перегруппировать ваши данные, но жаль тратить на это часы ручного труда; вам нужно освоить самые современные методы, еще не нашедшие отражения в большинстве статистических пакетов, то эта книга – для вас!
Перед вами исчерпывающее руководство по основам Data Science. С помощью него вы сможете научиться мыслить статистически и понимать, какую роль в вашей работе играет аналитика, пользоваться языком науки о данных, избегать распространенных ошибок при работе с ними и, наконец, разобраться в полезных инструментах, которые используют эксперты. В этой книге вы познакомитесь с инструментами, терминами и образом мышления, необходимыми для навигации по промышленному комплексу науки о данных. Вы научитесь понимать данные и связанные с ними проблемы на более глубоком уровне, критически относиться к данным и результатам, с которыми сталкиваетесь, а также разумно говорить обо всем, что касается данных. Короче говоря, вы станете главным по данным.
MATLAB (сокращение от англ. «Matrix Laboratory») — пакет прикладных программ для решения задач технических вычислений и одноимённый язык программирования, используемый в этом пакете. Скачав на cwer.ru MATLAB, созданный компанией MathWorks, вы сможете легко производить матричные вычисления, визуализировать математические функции и экспериментальные данные, реализовывать вычислительные алгоритмы, конструировать графический интерфейс пользователя для решения специфических задач, а также через специальные интерфейсы взаимодействовать с другими языками программирования и программами.
Lansweeper - программа для анализа различных параметров находящихся в сети компьютеров. Программа интегрируется в Active Directory, позволяет выводить собранную информацию через web-интерфейс или собственные запросы, хранит информацию в базе sql-сервера. Не требует установки клиентской части на компьютеры пользователей (достаточно, чтобы компьютеры находились в пределах одного домена).
При работе любого корпоративного приложения образуются данные: файлы журналов, показатели, информация об активности пользователей, исходящие сообщения и другие. Правильное управление этими данными не менее важно, чем сами данные. Если вы архитектор, разработчик или инженер-технолог, но вы пока не знакомы с Apache Kafka, то из этой обновленной книги вы узнаете, как работать с потоковой платформой Kafka, позволяющей обрабатывать потоки данных в реальном времени. Дополнительные главы посвящены API AdminClient от Kafka, транзакциям, новым функциям безопасности и изменениям в инструментарии. Инженеры из Confluent и LinkedIn, ответственные за разработку Kafka, объясняют, как с помощью этой платформы развертывать производственные кластеры Kafka, писать надежные управляемые событиями микросервисы и создавать масштабируемые приложения для потоковой обработки данных. На подробных примерах вы изучите принципы проектирования Kafka, гарантии надежности, ключевые API и детали архитектуры.
Работа с неограниченными и быстрыми потоками данных всегда была сложной задачей. Но Kafka Streams и ksqlDB позволяют легко и просто создавать приложения потоковой обработки. Из книги специалисты по обработке данных узнают, как с помощью этих инструментов создавать масштабируемые приложения потоковой обработки, перемещающие, обогащающие и преобразующие большие объемы данных в режиме реального времени. Kafka Streams — это легкая, но мощная библиотека Java для обогащения, преобразования и обработки потоков данных в реальном времени. Митч Сеймур, инженер службы обработки данных в Mailchimp, объясняет важные понятия потоковой обработки на примере нескольких любопытных бизнес-задач. Он рассказывает о достоинствах Kafka Streams и ksqlDB, чтобы помочь вам выбрать наиболее подходящий инструмент.