• صفحه اصلی
  • جستجوی پیشرفته
  • فهرست کتابخانه ها
  • درباره پایگاه
  • ارتباط با ما
  • تاریخچه

عنوان
Applied text analysis with Python :

پدید آورنده
Benjamin Bengfort, Rebecca Bilbro, and Tony Ojeda.

موضوع
Machine learning.,Natural language processing (Computer science),Python (Computer program language),COMPUTERS-- Programming Languages-- Python.,Machine learning.,Natural language processing (Computer science),Python (Computer program language)

رده
QA76
.
73
.
P98

کتابخانه
مرکز و کتابخانه مطالعات اسلامی به زبان‌های اروپایی

محل استقرار
استان: قم ـ شهر: قم

مرکز و کتابخانه مطالعات اسلامی به زبان‌های اروپایی

تماس با کتابخانه : 32910706-025

شابک

شابک
1491962992
شابک
1491963018
شابک
1491963042
شابک
9781491962992
شابک
9781491963012
شابک
9781491963043
شابک اشتباه
9781491963043

عنوان و نام پديدآور

عنوان اصلي
Applied text analysis with Python :
نام عام مواد
[Book]
ساير اطلاعات عنواني
enabling language-aware data products with machine learning /
نام نخستين پديدآور
Benjamin Bengfort, Rebecca Bilbro, and Tony Ojeda.

وضعیت ویراست

وضعيت ويراست
First edition.

وضعیت نشر و پخش و غیره

محل نشرو پخش و غیره
Sebastopol, CA :
نام ناشر، پخش کننده و غيره
O'Reilly Media,
تاریخ نشرو بخش و غیره
[2018]
تاریخ نشرو بخش و غیره
©2018

مشخصات ظاهری

نام خاص و کميت اثر
1 online resource (xviii, 310 pages) :
ساير جزييات
illustrations

یادداشتهای مربوط به کتابنامه ، واژه نامه و نمایه های داخل اثر

متن يادداشت
Includes bibliographical references and index.

یادداشتهای مربوط به مندرجات

متن يادداشت
Cover; Copyright; Table of Contents; Preface; Computational Challenges of Natural Language; Linguistic Data: Tokens and Words; Enter Machine Learning; Tools for Text Analysis; What to Expect from This Book; Who This Book Is For; Code Examples and GitHub Repository; Conventions Used in This Book; Using Code Examples; O'Reilly Safari; How to Contact Us; Acknowledgments; Chapter 1. Language and Computation; The Data Science Paradigm; Language-Aware Data Products; The Data Product Pipeline; Language as Data; A Computational Model of Language; Language Features; Contextual Features.
متن يادداشت
Corpus TransformationIntermediate Preprocessing and Storage; Reading the Processed Corpus; Conclusion; Chapter 4. Text Vectorization and Transformation Pipelines; Words in Space; Frequency Vectors; One-Hot Encoding; Term Frequency-Inverse Document Frequency; Distributed Representation; The Scikit-Learn API; The BaseEstimator Interface; Extending TransformerMixin; Pipelines; Pipeline Basics; Grid Search for Hyperparameter Optimization; Enriching Feature Extraction with Feature Unions; Conclusion; Chapter 5. Classification for Text Analysis; Text Classification.
متن يادداشت
Identifying Classification ProblemsClassifier Models; Building a Text Classification Application; Cross-Validation; Model Construction; Model Evaluation; Model Operationalization; Conclusion; Chapter 6. Clustering for Text Similarity; Unsupervised Learning on Text; Clustering by Document Similarity; Distance Metrics; Partitive Clustering; Hierarchical Clustering; Modeling Document Topics; Latent Dirichlet Allocation; Latent Semantic Analysis; Non-Negative Matrix Factorization; Conclusion; Chapter 7. Context-Aware Text Analysis; Grammar-Based Feature Extraction; Context-Free Grammars.
متن يادداشت
Structural FeaturesConclusion; Chapter 2. Building a Custom Corpus; What Is a Corpus?; Domain-Specific Corpora; The Baleen Ingestion Engine; Corpus Data Management; Corpus Disk Structure; Corpus Readers; Streaming Data Access with NLTK; Reading an HTML Corpus; Reading a Corpus from a Database; Conclusion; Chapter 3. Corpus Preprocessing and Wrangling; Breaking Down Documents; Identifying and Extracting Core Content; Deconstructing Documents into Paragraphs; Segmentation: Breaking Out Sentences; Tokenization: Identifying Individual Tokens; Part-of-Speech Tagging; Intermediate Corpus Analytics.
متن يادداشت
Syntactic ParsersExtracting Keyphrases; Extracting Entities; n-Gram Feature Extraction; An n-Gram-Aware CorpusReader; Choosing the Right n-Gram Window; Significant Collocations; n-Gram Language Models; Frequency and Conditional Frequency; Estimating Maximum Likelihood; Unknown Words: Back-off and Smoothing; Language Generation; Conclusion; Chapter 8. Text Visualization; Visualizing Feature Space; Visual Feature Analysis; Guided Feature Engineering; Model Diagnostics; Visualizing Clusters; Visualizing Classes; Diagnosing Classification Error; Visual Steering; Silhouette Scores and Elbow Curves.
بدون عنوان
0
بدون عنوان
8
بدون عنوان
8
بدون عنوان
8
بدون عنوان
8

یادداشتهای مربوط به خلاصه یا چکیده

متن يادداشت
From news and speeches to informal chatter on social media, natural language is one of the richest and most underutilized sources of data. Not only does it come in a constant stream, always changing and adapting in context; it also contains information that is not conveyed by traditional data sources. The key to unlocking natural language is through the creative application of text analytics. This practical book presents a data scientist's approach to building language-aware products with applied machine learning. You'll learn robust, repeatable, and scalable techniques for text analysis with Python, including contextual and linguistic feature engineering, vectorization, classification, topic modeling, entity resolution, graph analysis, and visual steering. By the end of the book, you'll be equipped with practical methods to solve any number of complex real-world problems. Preprocess and vectorize text into high-dimensional feature representations. Perform document classification and topic modeling. Steer the model selection process with visual diagnostics. Extract key phrases, named entities, and graph structures to reason about data in text. Build a dialog framework to enable chatbots and language-driven interaction. Use Spark to scale processing power and neural networks to scale model complexity.--Provided by publisher.

یادداشتهای مربوط به سفارشات

منبع سفارش / آدرس اشتراک
Safari Books Online
شماره انبار
CL0500000981

ویراست دیگر از اثر در قالب دیگر رسانه

عنوان
Applied text analysis with Python.

موضوع (اسم عام یاعبارت اسمی عام)

موضوع مستند نشده
Machine learning.
موضوع مستند نشده
Natural language processing (Computer science)
موضوع مستند نشده
Python (Computer program language)
موضوع مستند نشده
COMPUTERS-- Programming Languages-- Python.
موضوع مستند نشده
Machine learning.
موضوع مستند نشده
Natural language processing (Computer science)
موضوع مستند نشده
Python (Computer program language)

مقوله موضوعی

موضوع مستند نشده
COM-- 051360

رده بندی ديویی

شماره
005
.
133
ويراست
23

رده بندی کنگره

شماره رده
QA76
.
73
.
P98

نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )

مستند نام اشخاص تاييد نشده
Bengfort, Benjamin,1984-

نام شخص - (مسئولیت معنوی برابر )

مستند نام اشخاص تاييد نشده
Bilbro, Rebecca
مستند نام اشخاص تاييد نشده
Ojeda, Tony

مبدا اصلی

تاريخ عمليات
20200823033040.0
قواعد فهرست نويسي ( بخش توصيفي )
pn

دسترسی و محل الکترونیکی

نام الکترونيکي
 مطالعه متن کتاب 

اطلاعات رکورد کتابشناسی

نوع ماده
[Book]

اطلاعات دسترسی رکورد

تكميل شده
Y

پیشنهاد / گزارش اشکال

اخطار! اطلاعات را با دقت وارد کنید
ارسال انصراف
این پایگاه با مشارکت موسسه علمی - فرهنگی دارالحدیث و مرکز تحقیقات کامپیوتری علوم اسلامی (نور) اداره می شود
مسئولیت صحت اطلاعات بر عهده کتابخانه ها و حقوق معنوی اطلاعات نیز متعلق به آنها است
برترین جستجوگر - پنجمین جشنواره رسانه های دیجیتال