Thứ Hai, 22 tháng 4, 2019

Tiền xử lý dữ liệu Python

Tiền xử lý dữ liệu Python
Machine Learning vẫn còn là một thứ mới mẻ và khiến mình tò mò, cho nên hôm nay mình đã bắt đầu tham gia một khóa học về nó. Chuỗi các bài “Tôi học Machine Learning” là những ghi chú của mình, chứ không phải là bài hướng dẫn, vì vậy có thể có những sai sót chủ quan trong...

Khóa học lập trình python cơ bản cho người mới bắt đầu - P2

Khóa học lập trình python cơ bản cho người mới bắt đầu - P2
Numpy Phần tiếp theo trong khóa học lập trình python này sẽ trình bày về thư viện toán học numpy. Đây là một thư viện hỗ trợ đắc lực cho tính toán ma trận. Để biết cụ thể numpy là cái gì chúng ta hãy cũng nhau tìm hiểu nh...

Khóa học lập trình python cơ bản cho người mới bắt đầu - P1

Khóa học lập trình python cơ bản cho người mới bắt đầu - P1
Giới thiệu về khóa học lập trình python khóa học lập trình python này được viết dành cho các bạn sử dụng python cho các bài toán machine learning. Do đó, ngoài hướng dẫn về học lập trình python ra bạn sẽ học được các kỹ thuật, cách sử dụng một số thư viện phục vụ cho...

Thư viện pandas python – Hướng dẫn pandas python cho người mới

Thư viện pandas python – Hướng dẫn pandas python cho người mới
Thư viện pandas python là gì? Nó có thể giúp bạn những gì và làm sao để sử dụng thư viện pandas này trong lập trình python. Hãy cùng tôi đi tìm câu trả lời cho các câu hỏi trên trong bài viết ngày hôm nay. Tôi tin rằng đây là một bài viết cực kỳ hữu ích. Nó chắc chắn sẽ...

Chủ Nhật, 21 tháng 4, 2019

[Thuật toán phân cụm k-means] và code minh họa bài toán phân cụm

[Thuật toán phân cụm k-means] và code minh họa bài toán phân cụm
Thuật toán phân cụm dữ liệu có tên là k-means. Phần mở đầu mình sẽ giới thiệu về thuật toán phân cụm k-means. Tiếp đến mình sẽ trình bày tới ý tưởng giải quyết bài toán phân cụm với k-means. Và sau cùng sẽ là mình và các bạn sẽ cùng thực hiện code minh họa bài toán phân...

[Thuật toán CNN] trong xử lý ngôn ngữ tự nhiên

[Thuật toán CNN] trong xử lý ngôn ngữ tự nhiên
Thuật toán CNN đã cho thấy sự thành công trong một số bài toán phân loại văn bản. Trong [1], tác giả đã đưa ra một mô hình CNN đơn giản với việc điều chỉnh vài siêu tham số và sử dùng một pre-train word2vec. Cho thấy kết quả cực kỳ tốt. Giải pháp này đã giúp cải thiện...

[Thuật toán linear regression] và bài toán dự đoán điểm thi

[Thuật toán linear regression]  và bài toán dự đoán điểm thi
Trong bài viết ngày hôm nay, mình sẽ cùng các bạn giới thiệu về thuật toán linear regression và áp dụng vào bài toán dự đoán điểm th...

[Khóa học tensorflow] Bài 5 – Xây dựng mô hình Neural Network

[Khóa học tensorflow] Bài 5 – Xây dựng mô hình Neural Network
Mô tả bài toán và bộ dữ liệu MNIST MNIST là bộ dữ liệu là các con số viết tay từ 0 đến 9. Bộ dữ liệu này bao gồm 60.000 mẫu cho huấn luyện và 10.000 mẫu để kiểm thử. Các mẫu dữ liệu trong bộ MNIST đã được chuẩn hóa về kích thước: căn chỉnh chính giữa dữ liệu, và mỗi mẫu...

[Khóa học tensorflow] Bài 4 – Xây dựng mô hình logistic regression

[Khóa học tensorflow] Bài 4 – Xây dựng mô hình logistic regression
Sự khác nhau giữa linear model và logistic model Có 3 sự khác nhau chín...

[Khóa học tensorflow] Bài 3 – Xây dựng mô hình linear regression

[Khóa học tensorflow] Bài 3 – Xây dựng mô hình linear regression
Xây dựng mô hình Linear regression sử dụng Tensorflow Để các bạn dễ hình dung với bài toán, ta có thể xét bài toán thực tế như sau: Bạn có một tập dữ liệu thể hiện giá của căn hộ(y) và diện tích của căn hộ đó(x). Và công việc chúng ta cần làm là làm sao ta có thể dự đoán...

[Khóa học tensorflow] Bài 2 – Các toán tử cơ bản trong Tensorflow

[Khóa học tensorflow] Bài 2 – Các toán tử cơ bản trong Tensorflow
Trong bài viết ngày hôm nay, mình sẽ trình bày về các toán tử trong Tensorflow, bao gồm các nội dung sau: TensorBoard Constant, Variable, Placeholder, Operations Lazy load...

[Khóa học tensorflow] Bài 1 – Tổng quan về thư viện Tensorflow

[Khóa học tensorflow] Bài 1 – Tổng quan về thư viện Tensorflow
Trong bài viết ngày hôm nay, mình sẽ trình bày tổng quan về thư viện Tensorflow, bao gồm các nội dung sau: Giới thiệu tổng quan về Tensorflow Graph và Sessi...

[Khóa học tensorflow] Bài 0 – Giới thiệu về khóa học Tensorflow

[Khóa học tensorflow] Bài 0 – Giới thiệu về khóa học Tensorflow
Giới thiệu về tensorflow: Tensorflow là gì? Tensorflow là một thư viện mã nguồn mở mạnh mẽ cho machine learning được phát triển bởi các nhà cứu của Google. Thư viên này có rất nhiều các hàm được xây dựng sẵn cho từng bài toán cho phép xây dựng nhiều mạng neural network...

Học có giám sát là gì? Định nghĩa và ví dụ về học giám sát

Học có giám sát là gì? Định nghĩa và ví dụ về học giám sát
Học có giám sát là gì? Học có giám sát (supervised learning) là một kỹ thuật của ngành học máy nhằm mục đích xây dựng một hàm f từ dữ tập dữ liệu huấn luyện (Training data). Dữ liệu huấn luyện bao gồm các cặp đối tượng đầu vào và đầu ra mong muốn. Đầu ra của hàm f có thể...

Thứ Sáu, 5 tháng 4, 2019

Merge and Join DataFrames with Pandas in Python

Merge and Join DataFrames with Pandas in Python
In any real world data science situation with Python, you’ll be about 10 minutes in when you’ll need to merge or join Pandas Dataframes together to form your analysis dataset. Merging and joining dataframes is a core process that any aspiring data...

Using iloc, loc, & ix to select rows and columns in Pandas DataFrames

Using iloc, loc, & ix to select rows and columns in Pandas DataFrames
Pandas Data Selection There are multiple ways to select and index rows and columns from PandasDataFrames. I find tutorials online focusing on advanced selections of row and column choices a little complex for my requirement...

Summarising, Aggregating, and Grouping data in Python Pandas

Summarising, Aggregating, and Grouping data in Python Pandas
Pandas – Python Data Analysis Library I’ve recently started using Python’s excellent Pandas library as a data analysis tool, and, while finding the transition from R’s excellent data.table library frustrating at times, I’m finding my way around and...

Thứ Năm, 4 tháng 4, 2019

The Pandas DataFrame – loading, editing, and viewing data in Python

The Pandas DataFrame – loading, editing, and viewing data in Python
Starting out with Python Pandas DataFrames If you’re developing in data science, and moving from excel-based analysis to the world of Python, scripting, and automated analysis, you’ll come across the incredibly popular data management library, “Pandas” in Python....

Python Pandas read_csv – Load Data from CSV Files

Python Pandas read_csv – Load Data from CSV Files
CSV (comma-separated value) files are a common file format for transferring and storing data. The ability to read, manipulate, and write data to and from CSV files using Python is a key skill to master for any data scientist or business analysis. In this post, we’ll go...