1. Professional Scraping System Development
Technical Requirements:
System Architecture:
Design cross-platform Python crawling scripts
Build scalable systems
Develop parallel crawling solutions
Manage large, multi-threaded data streams
Technologies:
Scrapy, BeautifulSoup
Selenium
Asyncio, Multiprocessing
Proxy management
IP rotation techniques
2. Data Processing and Normalization
Processing Methods:
Develop API data cleaning processes
Data transformation algorithms
Integrity checks
Remove noisy data
Tools:
Pandas
Data validation techniques
Machine Learning preprocessing
3. Database Management
Specialized Skills:
Advanced SQL:
Complex queries
Performance optimization
4. Monitoring & Optimization
Strategy:
Manage scraping system operations.
Track scraping performance
Challenge handling:
IP blocking
Speed limiting
CAPTCHA
PROFESSIONAL REQUIREMENTS
Education
Bachelor's degree (GPA > 3.0)
Major:
Data science
Computer engineering
Data related fields
English: TOEIC > 700 of IELTS >5.5
Technical Skills
Python Ecosystem
Asyncio, Multiprocessing
Data cleaning techniques
Machine Learning preprocessing
Advanced error handling
Database & Big Data
SQL (Intermediate to Advanced)
NoSQL database management
PySpark
Data warehousing
In-depth Experience
Minimum 1-2 years
Project implementation:
Web scraping
Automatic data processing
Big data crawling
SOFT SKILLS
System analysis
Problem solving
Independent & team working
Time management
Logical thinking
NICE TO HAVE EXPERIENCES
Big Data experience
Data pipeline design
Working with diverse APIs
Professional certifications
Creativity and initiative in proposing ideas
-Enjoy full social insurance, health insurance, labor contracts, vacation days and other benefits according to state regulations.
-Parking allowance
-Regular annual salary increase
-Training and capacity development to meet job requirements and promotion path
-Participate in courses when necessary
-Weekly/monthly/quarterly/yearly bonuses and project bonuses
-Holiday/Tet bonuses
-Young, friendly and dynamic working environment.
-Travel: 1 time/year
19 Ho Van Hue, Ward 9, Phu Nhuan District
Công ty Cổ phần Webify Group, thành lập vào tháng 6/2022, là một thành viên quan trọng của hệ sinh thái của Webify Global Pte. Ltd. có trụ sở Singapore. Chúng tôi hoạt động chuyên sâu trong lĩnh vực phát triển Website và Ứng dụng Di động, đem đến cho khách hàng những giải pháp công nghệ hiệu quả và đổi mới.
TRỢ KÝ GIÁM ĐỐC (Doanh nghiệp CÔNG TY CỔ PHẦN THƯƠNG MẠI DỊCH VỤ TRUYỀN THÔNG QUỐC TẾ TOÀN CẦU)
Giáo Viên Dạy Đàn Piano (Full-Time) (Doanh nghiệp Công ty cổ phần DAYONE ASIA)
Chuyên Viên Kế Toán Nghiệp Vụ (Doanh nghiệp CÔNG TY TNHH THACO AUTO BÌNH TÂN - TP.HCM)
Nhân viên bộ phận Đầu tư (Doanh nghiệp KHÁCH SẠN ĐỒNG KHÁNH)
Thực Tập Sinh Biên Phiên Dịch Tiếng Nhật Ngành IT (Doanh nghiệp W2SOLUTION VIETNAM)