Trong nghiên cứu khoa học, có rất nhiều phần mềm quản lý số liệu. Tuy nhiên, Epidata là phần mềm quản lý số liệu được ưu ái hơn cả do nhiều tính năng thuận tiện cho người dùng của nó.
Epidata là gì? EpiData là phần mềm hỗ trợ nhập và quản lý số liệu, được lập trình bởi bác sĩ Jens M.Lauritsen người Đan Mạch.
Ưu điểm của sử dụng epidata trong quản lí số liệu:
- Đơn giản, dễ sử dụng, giao diện thân thiện
- Gọn nhẹ, miễn phí
- Phù hợp với Window hoặc Macintosh
- Có thể xuất số liệu sang nhiều dạng khác nhau để sử dụng cho phân tích số liệu bằng các phần mềm như Stata, Spss,…
- Được sử dụng rộng rãi trong quản lý số liệu của các dự án nghiên cứu nhỏ và vừa.
- Tham khảo: Thiết bị điện Haky
Một số khái niệm:Tệp số liệu, bản ghi, biến/trường, nhãn
Hình 1: Mô tả biến và bản ghi trong epidata
Hình 2: Mô tả tệp số liệu trong epidata
Hình 3: Mô tả trường số liệu trong epidata
Kiểu dữ liệu trong epidata
- Kiểu ID number
Là kiểu dữ liệu số tự động và có các đặc điểm sau:
Chuỗi định dạng là <IDNUM>
Một trường số liệu được khai báo kiểu ID number thì giá trị số liệu của trường sẽ được tự động nhập khi nhập số liệu. Người sử dụng không được nhập giá trị cho trường này.
Kiểu ID number thường được sử dụng để khai báo cho trường khóa. Trường khóa là trường chứa số liệu định danh cho bản ghi. Đặc điểm của trường khóa là trong tất cả các bản ghi của một tệp dữ liệu sẽ không có cặp bản ghi nào có cùng giá trị tại trường khóa. Dựa vào số liệu trường khóa, ta luôn tìm được bản ghi duy nhất tương ứng với nó trong tệp số liệu.
Ví dụ: Khai báo trường mã số phỏng vấn có tên trường là IDX, kiểu số tự động, có nhãn là “so thu tu phong van”
IDX so thu tu phong van <IDNUM>
- Kiểu Numeric
Kiểu Numeric là kiểu dữ liệu số dùng để khai báo cho các trường số liệu dạng số như tuổi, thu nhập, chiều cao, cân nặng… Kiểu dữ liệu này có đặc điểm sau:
Chuỗi định dạng sử dụng ký tự #, ví dụ ###, hoặc ###.###…
Trường được khai báo kiểu số chỉ chấp nhận số liệu nhập vào ở dạng số
Độ rộng của trường được xác định bằng số kí tự # được khai báo
Kích cỡ lỡn nhất số liệu nhập vào một trường có kiểu số là 14 chữ số gồm cả ký tự “.” Ngăn cách phần số nguyên và phần thập phân với số thập phân.
Ví dụ: Khai báo một trường có tên v1 và có 8 chữ số là số nguyên, có nhãn biến là “tong thu nhap” dùng để lưu thu nhập hộ gia đình, viết như sau:
V1 “tong thu nhap” #######
Nếu khai báo trường số liệu trên dạng số thập phân với phần thập phân có hai số, viết như sau:
V1 tong thu nhap #######.##
- Kiểu text
Kiểu text là kiểu dữ liệu văn bản (còn gọi là kiểu chuỗi ký tự), thường được sử dụng khai báo cho các trường số liệu dạng văn bản như họ và tên, địa chỉ, ghi chú…
Chuỗi định dạng là sử dụng ký tự “_” hoặc <E >
Chuỗi văn bản nhập vào có thể gồm các ký tự a, b, c,… và kể cả các chữ số
Độ rộng của trường lớn nhất là 80 ký tự
Khi khai báo mỗi dấu “_” tương ứng với khai báo cho một ký tự
Ví dụ 1: Khai báo trường họ tên với đô rộng 25 kí tự thì sẽ có 25 dấu “_” trong phần khai báo
V2 ho ten _________________________
Ví dụ 2: khi muốn khai báo trường V3 kiểu text có 7 kí tự, dữ liệu nhập được mã hóa và bảo mật, ta khai báo như sau:
V3 “mat khau” <E >
Số dấu cách (kí tự trắng) trong cặp “<E” và “>” là 7 tương ứng khai báo cho giá trị mật khẩu 7 kí tự.
- Kiểu Upper-case text
Đây cũng là một kiểu dữ liệu văn bản, kiểu này có các đặc tính sau:
Chuỗi định dạng là <A>, hoặc <A >
Trường được khai báo kiểu Upper-case text thì số liệu nhập vào trường này được hiểu là dạng văn bản và được tự động chuyển sang dạng kí tự viết hoa
Độ rộng của trường tương ứng với số ký tự “trống” (dấu cách) giữa hai dấu “<” và “>”.
- Kiểu Bloolean
Đây là kiểu dữ liệu logic. Trường được khai báo kiểu này chỉ chấp nhận giá trị Y hoặc N (cũng có thể chấp nhận số 0 hoặc 1) và chuỗi định dạng là <Y>.
Ví dụ: Khai báo biến giới tính có tên là V4, trong đó, giá trị Y thể hiện giới tính là nữ và N thể hiện giới tính nam:
V4 “gioi tinh” <Y>
- Kiểu Date
Kiểu dữ liệu Date được sử dụng để khai báo cho các trường số liệu dạng ngày tháng, và có các đặc điểm sau:
Chuỗi định dạng là <dd/mm/yyyy> hoặc <mm/dd/yyyy>, hoặc <yyyy/mm/dd>
Trường được khai báo kiểu Date chỉ chấp nhận giá trị nhập vào dạng ngày tháng theo định dạng đã khai báo
Kiểu số liệu ngày tháng có độ rộng là 10 ký tự gồm cả ký tự ngăn cách (“/” hoặc “-”) giữa các thành phần ngày, tháng, năm
Ví dụ: Khai báo biến ngày sinh tên là V5:
V5 “ngày sinh” <dd/mm/yyyy>
- Kiểu today’s date
Đây cũng là một kiểu dữ liệu thể hiện số liệu ngày tháng. Các đặc điểm của kiểu dữ liệu này gồm:
Chuỗi định dạng là <today-dmt> hoặc <today-mdy>, hoặc <today-ymd>
Một trường được khai báo kiểu Today’s date sẽ được tự động điền vào giá trị ngày hiện tại (ngày của máy tính) khi nhập liệu
Ví dụ: Khai báo ngày nhập số liệu tên là V6:
V6 “ngay nhap lieu” <today-dmy>
- Kiểu soundex
Kiểu Soundex là kiểu dữ liệu mã hóa. Số liệu nhập vào trường này sẽ được epidata tự động mã hóa (chuyển sang một giá trị khác) theo quy luật mã hóa của epidata trước khi lưu vào cơ sở dữ liệu
Chuỗi định dạng là <S >
Trường số liệu kiểu Soundex chấp nhận tất cả các ký tự. Trừ kí tự đầu tiên, các kí tự còn lại sẽ được tự động mã hóa
Khuôn dạng của chuỗi mã hóa là A-999, tức là chuỗi mã hóa gồm một kí tự đầu và tiếp theo là dấu “-” và ba chữ số. Khi chuỗi nhập vào là HOLMES, chữ H được giữ lại và chuỗi “OLMES” được mã hóa thành 452 và ta có chuỗi sau mã hóa là H-452.
Ví dụ: Khai báo biến tên tỉnh có tên biến là V7:
V7 “ten tinh” <S >
- Chỉ định Tabulator code
Chỉ định Tabulator code được sử dụng khi khái báo trường câu hỏi, nhằm chỉ dẫn cho epidata về việc thực hiện căn lề cho các thành phần trên Mẫu biểu (cửa sổ nhập liệu) nhập liệu
Ký tự định dạng là @
Bình thường thì trên Mẫu biểu nhập liệu các thành phần (các câu hỏi) không được căn lề. Tabulator code sẽ giúp giải quyết vấn đề trên.
Ví dụ: Khai báo các câu hỏi được căn lề đều theo lề trái như sau:
V1 “ma so” @<IDNUM>
V2 “ho ten” @_________________