Geographic information quality principles



tải về 354.17 Kb.
trang6/10
Chuyển đổi dữ liệu26.11.2017
Kích354.17 Kb.
#2980
1   2   3   4   5   6   7   8   9   10



Để giảm thiểu các công việc nhằm tạo ra, lưu trữ và giải thích siêu dữ liệu cho ví dụ, có thể thấy rằng các thông tin chất lượng chỉ được báo cáo như là siêu dữ liệu cho các tập dữ liệu và các dữ liệu quy định bởi phạm vi chất lượng dữ liệu bao gồm các "tuyến đường", "đường sắt", và "đường ống". Chất lượng thông tin cho các dữ liệu được quy định bởi phạm vi chất lượng dữ liệu bao gồm các "dòng suối" sẽ được bỏ qua.

ISO 19115 không cung cấp một cách rõ ràng để ghi thông tin chất lượng định lượng bằng siêu dữ liệu cho các đối tượng cụ thể, giá trị thuộc tính hoặc các sự kiện duy nhất của mối quan hệ đối tượng (điều này có thể được phá vỡ bằng cách xác định các dữ liệu theo quy định của một phạm vi chất lượng dữ liệu bao gồm một đối tượng dữ liệu cụ thể, giá trị thuộc tính hoặc sự xuất hiện riêng của mối quan hệ đối tượng). Thông tin chất lượng định lượng xuất hiện những mục riêng, khác với kiểu cha mẹ của chúng, có thể thực hiện bằng việc mang thông tin chất lượng như một thuộc tính xuất hiện trong tập dữ liệu. Nguyên lý có thứ bậc để báo cáo cũng có thể được áp dụng giữa những kiểu và những sự xuất hiện. Điều đó gợi ý rằng thông tin chất lượng định lượng cho một đối tượng cụ thể chỉ được báo cáo khi nó khác với kiểu đối tượng cha mẹ của chúng, thông tin chất lượng cho một giá trị thuộc tính chỉ được ghi lại khi nó khác với thuộc tính cha mẹ của chúng, thông tin chất lượng cho mối quan hệ đối tượng xuất hiện riêng chỉ được báo cáo khi nó khác với mối quan hệ đối tượng cha mẹ của chúng. Bằng cách thức mà trong đó thuộc tính trong một tập dữ liệu xuất hiện là tập dữ liệu phụ thuộc, hướng dẫn cho thuộc tính thực tế của thông tin chất lượng về đối tượng cụ thể, giá trị thuộc tính và các sự xuất hiện riêng của các mối quan hệ đối tượng thì không được cung cấp.

Hình B.2 minh họa các mức phân cấp của một tập dữ liệu mà thông tin chất lượng định lượng được báo cáo bằng siêu dữ liệu và phương pháp báo cáo được đề xuất (hoặc như một phần của một tập tin siêu dữ liệu hoặc kho lưu trữ hoặc như thuộc tính trong một tập dữ liệu).

ISO 19114 đề cập đến vấn đề thừa của thông tin chất lượng định lượng và nhu cầu để nén thông tin này cũng như vấn đề yêu cầu thông tin chất lượng định lượng chi tiết hơn thông qua việc sử dụng một báo cáo đánh giá chất lượng.



In order to minimize the effort of creating, storing and interpreting metadata for the example, it is suggested that the quality information be reported as metadata only for the dataset and the data specified by the data quality scopes consisting of “roads”, “railroads”, and “pipelines”. Quality information for the data specified by the data quality scope consisting of “streams” would be omitted.

ISO 19115 does not explicitly provide for the recording of quantitative quality information as metadata for feature instances, attribute values or single occurrences of feature relationships (this may be circumvented by identifying the data specified by a data quality scope as consisting of a feature instance, attribute value or single occurrence of a feature relationship). Quantitative quality information for single occurrences of items, when differing from their parent types, may be implemented by carrying the quality information as an attribute of the occurrence within a dataset. The hierarchical principle for reporting may also be applied between types and occurrences. It is suggested quantitative quality information for a feature instance be reported only when differing from that of its parent feature type, quality information for an attribute value be reported only when differing from that of its parent feature attribute and quality information for a single occurrence of a feature relationship be reported only when differing from that of its parent feature relationship. As the manner in which the attribution within a dataset occurs is dataset dependent, guidelines for the actual attribution of quality information on feature instances, attribute values and single occurrences of feature relationships is not provided.

Figure B.2 illustrates the hierarchical levels of a dataset for which quantitative quality information is reported as metadata and the suggested reporting method (either as part of a metadata file or repository or as attribution within a dataset).

ISO 19114 addresses the problem of an overabundance of quantitative quality information and the need to compress this information as well as the problem of requiring more detailed quantitative quality information through the use of a quality evaluation report.



B.4.2.2 Báo cáo thông tin chất lượng phi định lượng bằng siêu dữ liệu.

Thông tin chất lượng cho mục đích và cách sử dụng các phần tử tổng quan chất lượng dữ liệu được coi là thông tin quan trọng đối với tập dữ liệu và chỉ được ghi cho tập dữ liệu. Nếu tập dữ liệu thuộc bộ dữ liệu có cùng mục đích và cách sử dụng, tiêu chuẩn Quốc tế này cho phép thay thế mục đích và cách sử dụng của bộ dữ liệu. Trong trường hợp thay thế, siêu dữ liệu của tập dữ liệu có thể trỏ tới mục đích và cách sử dụng của siêu dữ liệu trong bộ dữ liệu chứ không lặp lại thông tin.

Thông tin chất lượng cho nguồn gốc phần tử tổng quan chất lượng dữ liệu được coi là thông tin quan trọng tới tập dữ liệu. Hơn nữa , thông tin nguồn gốc có thể được thu thập và khác nhau giữa tập dữ liệu và nhiều nhóm dữ liệu nhỏ hơn được quy định bởi phạm vi chất lượng dữ liệu. Nó gợi ý rằng nguồn gốc cho một nhóm dữ liệu nhỏ hơn được quy định bởi phạm vi chất lượng dữ liệu chỉ được báo cáo nếu khác với nguồn gốc được báo cáo trong tập dữ liệu. (Ngược lại, Tiêu chuẩn quốc tế này cho phép báo cáo thông tin nguồn gốc cho một bộ dữ liệu bao hàm tập dữ liệu đó chứ không phải nguồn gốc thực của tập dữ liệu. Trong trường hợp thay thế, siêu dữ liệu của tập dữ liệu có thể chỉ ra nguồn gốc trong siêu dữ liệu của bộ dữ liệu chứ không lặp lại thông tin).


B.4.2.2 Reporting non-quantitative quality information as metadata

Quality information for the data quality overview elements purpose and usage are considered essential information pertaining only to the dataset and are recorded only for the dataset. If the dataset belongs to adataset series and shares similar purpose and usage information, this International standard allows the substitution of the dataset series’ purpose and usage. In the case of substitution, the dataset’s metadata ma point to the purpose and usage in the dataset series’ metadata rather than repeat the information.

Quality information for the data quality overview element lineage is considered essential information to the dataset. Additionally, lineage information may be collected for and differ between a dataset and the man smaller groupings of data specified by a data quality scope. It is suggested lineage for a smaller grouping data specified by a data quality scope be reported only if it differs from the lineage being reported for th dataset. (Again, this International standard allows the reporting of lineage information for a dataset series which a dataset belongs rather than the actual lineage of the dataset. In the case of substitution, the dataset’ metadata may point to the lineage in the dataset series’ metadata rather than actually repeat the information.)






Hình B.2 – Đề xuất phương pháp báo cáo thông tin chất lượng định lượng như siêu dữ liệu

image3

Figure B.2 — A suggested method of reporting quantitative quality information as metadata


Phụ lục C

(tham khảo)



Các phần tử chất lượng dữ liệu, các phần tử con chất lượng dữ liệu và các phần tử tổng quan chất lượng dữ liệu

Annex C

(informative)

Data quality elements, data quality subelements and data quality overview elements



C.1 VÍ DỤ 1 - Biểu đồ số của thế giới (DCW)

C.1 Example 1 - Digital Chart of the World (DCW)

C.1.1 Tổng quan

Ví dụ 1 minh hoạ việc đánh giá thông tin chất lượng định lượng của nhà sản xuất dữ liệu bằng cách xác định các phần tử chất lượng dữ liệu có thể ứng dụng và các phần tử con chất lượng dữ liệu sử dụng thông số kỹ thuật sản phẩm. Một khi phần tử con chất lượng dữ liệu được xác định là có thể ứng dụng được, thông số kỹ thuật sản phẩm được sử dụng bổ sung để xác định các phạm vi chất lượng dữ liệu phù hợp.

Ví dụ 1 cũng bao gồm sự đánh giá thông tin chất lượng phi định lượng của nhà sản xuất dữ liệu bằng cách biên tập thông tin cho các phần tử tổng quan chất lượng dữ liệu có thể ứng dụng

Ví dụ 1 không bao gồm báo cáo thực tế thông tin chất lượng có liên quan bằng siêu dữ liệu hoặc sử dụng báo cáo đánh giá chất lượng.



C.1.1 Overview

Example 1 illustrates a data producer’s assessment of relevant quantitative quality information by identifying applicable data quality elements and data quality subelements using the product specification. Once a data quality subelement is determined to be applicable, the product specification is additionally used to identify appropriate data quality scope(s).

Example 1 also includes the data producer’s assessment of non-quantitative quality information by compiling information for applicable data quality overview elements.

Example 1 does not include the actual reporting of the relevant quality information as metadata or using the quality evaluation report.



C.1.2 Thông tin cơ bản

Tập dữ liệu: Biểu đồ số của thế giới (DCW)

Đặc điểm kỹ thuật sản phẩm: Thông số Kỹ thuật quân sự MIL-D-89009, ngày 13 tháng 4 năm 1992

Miêu tả sản phẩm: (trích lược và tăng cường từ các thông số kỹ thuật sản phẩm)

DCW là cơ sở dữ liệu số toàn cầu đa dụng được thiết kế để hỗ trợ ứng dụng Hệ thống Thông tin Địa lý (GIS). Cơ sở dữ liệu DCW chứa 5 thư viện được trình bầy trong 4 đĩa CD-ROMs. Thư viện “BROWSE” chứa dữ liệu trên toàn thế giới ở tỉ lệ xấp xỉ 1/31000000, hỗ trợ hiển thị tổng quan ở tỉ lệ toàn cầu. Bốn thư viện “dữ liệu chi tiết”, mỗi thư viện trong một đĩa CD-ROM, 1) Bắc Mỹ, 2) Châu Âu và phía Bắc Châu Á, 3) Nam Mỹ, Châu Phi và Nam Cực, 4) phía Nam Châu Á và Úc ở tỉ lệ 1/1 000 000.

DCW sử dụng mô hình dữ liệu quan hệ địa lý Định dạng Sản phẩm Vectơ (VPF) để hỗ trợ dựa trên vectơ, lớp cơ sở dữ liệu chuyên đề. Thư viện “BROWSE” chứa 8 lớp chuyên đề, 4 thư viện chi tiết chứa 17 lớp chuyên đề. Đó là: 1)Hàng không, 2) Công trình Văn hóa đặc trưng, 3) Chất lượng Dữ liệu, 4) Hệ thống thoát nước, 5) Hệ thống thoát nước bổ sung, 6) Đo độ cao, 7) Đo độ cao bổ sung, 8) Lớp phủ, 9) Các Đối tượng Đại dương, 10) Cấu trúc vận tải, 11) Chính trị /Đại dương 12) Khu đông dân cư, 13) Đường sắt, 14) Tuyến đường bộ, 15) Cấu trúc Giao thông, 16) Hạ tầng, 17) Thực vật.

Sự kết hợp các thuộc tính và mã giá trị thuộc tính để định nghĩa từng đối tượng trong DCW.



C.1.2 Background information

Dataset: Digital Chart of the World (DCW)

Product specification: Military Specification MIL-D-89009, 13 April 1992

Product description: (extracted and condensed from the product specification)

The DCW is a general-purpose global digital database designed to support Geographic Information System (GIS) applications. The DCW database contains five libraries represented on four CD-ROMs. The BROWSE library contains worldwide data at approximately 1:31 000 000 scale, supporting overview displays at a global scale. The four “detailed data” libraries, one for each CD-ROM, contain data for (1) North America, (2) Europe and Northern Asia, (3) South America, Africa, and Antarctica, and (4) Southern Asia and Australia at 1:1000000 scale.

The DCW utilizes the Vector Product Format (VPF) georelational data model to support a vector-based, thematically layered database. The BROWSE library contains eight thematic layers; each of the four detailed data libraries contains seventeen thematic layers. These thematic layers are: (1) Aeronautical, (2) Cultural Landmarks, (3) Data Quality, (4) Drainage, (5) Drainage-Supplemental, (6) Hypsography, (7) Hypsography-Supplemental (8) Land Cover (9) Ocean Features, (10) Physiography, (11) Political/Oceans, (12) Populated Places, (13) Railroads, (14) Roads, (15) Transportation structure, (16) utilities and (17) Vegetation.

Attributes and attribute value code combinations define each feature in the DCW.


C.1.3 Đánh giá thông tin chất lượng định lượng liên quan

CHÚ THÍCH Nhà sản xuất dữ liệu không tìm ra tất cả các phần tử chất lượng dữ liệu và phần tử con chất lượng dữ liệu để có thể ứng dụng như không tham khảo tất cả thông số kỹ thuật sản phẩm. Chỉ các phần tử chất lượng dữ liệu có thể ứng dụng và phần tử con chất lượng dữ liệu có thể ứng dụng được liệt kê (xem trong bảng C.1).



C.1.3 Assessment of relevant quantitative quality information

NOTE The data producer did not find all data quality elements and data quality subelements to be applicable as not all were referenced in the product specification. Only applicable data quality elements and applicable data quality subelements are listed (see Table C.1).



Bảng C.1: Đánh giá thông tin chất lượng định lượng, Ví dụ 1

Các đoạn có liên quan từ việc áp dụng tài liệu đặc điểm kỹ thuật sản phẩm

có thể ứng dụng phần tử chất lượng dữ liệu /phần tử con chất lượng dữ liệu

Xác định phạm vi chất lượng dữ liệu

Số

văn bản

4.1.2.e

Xem xét lại mẫu được chọn ngẫu nhiên của các lớp khác nhau để đảm bảo sự đầy đủ dữ liệu bản đồ và thuộc tính (đối với 17 phạm vi chất lượng dữ liệu).

bao hàm tính hoàn thiện

sự đầy đủ



17 phạm vi chất lượng dữ liệu, mỗi phạm vi gồm 1 lớp chuyên đề

4.1.2.g

Xem xét lại định dạng dữ liệu nhà cung cấp cuối cùng trước khi chuyển đổi Định dạng Sản phẩm Véctơ (VPF) và ghi việc đếm tần số cuối cùng của tất cả các đối tượng cho mỗi lớp chuyên đề













3.1.2

Bảo đảm những chú thích ngoài lề số bao gồm các giá trị thuộc tính của phạm vi chất lượng dữ liệu và bảng chất lượng dữ liệu {(thông tin trước đấy xuất hiện trong chú thích, bảng, và đồ thị trên biên giới của bản đồ (Biểu đồ Dẫn đường Hoạt động (ONC) (vật chất nguồn)}

bao hàm tính hoàn thiện

không đầy đủ



tập dữ liệu













3.3

Đơn vị đo cơ sở dữ liệu DCW sẽ là hệ thống đo của Anh

Logic nhất quán/

miền nhất quán




tập dữ liệu

4.1.2.g

Xem xét lại dữ liệu nhà cung cấp cuối cùng trước khi chuyển đổi VPF. Tất cả tên và định nghĩa thuộc tính đều được kiểm tra lại













3.2.1

Gốc tọa độ đường nằm ngang theo Hệ thống Đo đạc Thế giới

(xác định phạm vi chất lượng = tập dữ liệu)


ổn định về lôgic

ổn định về dịnh dạng



1. tập dữ liệu

2. các đối tượng được mã hoá bằng điểm và polygon

3. các chuỗi văn bản


3.9

Hình đa giác (polygon) trên Biểu đồ Dẫn đường Hoạt động (vật chất nguồn) dưới đây có kích thước tối thiểu ít hơn hoặc bằng 3,5 mm (0,12 in) trong đường tròn, gồm 1 mép đơn, chúng được thể hiện bằng 1 điểm.

(xác định phạm vi chất lượng = các đối tượng mã hoá)

4.1.2.d

kiểm tra bảo đảm chất lượng sẽ được sử dụng như một phương tiện để xác định và sửa chữa những vấn đề xếp đặt văn bản. VÍ DỤ: kiểm tra sẽ được thực hiện để xác minh chuỗi văn bản không bị chồng chéo.

(xác định phạm vi chất lượng = chuỗi văn bản)















Table C.1 – Quantitative quality information assessment, Example 1

Relevant paragraphs from the product specification documenting applicability

Applicable data quality element/ data quality subelement

Identified data quality scope(s)

Number

Text

4.1.2.e

Review a random sample of tiles in various coverages to ensure cartographic and attribute data completeness (for all 17 data quality scopes).

completeness

commission

17 data quality scopes, each consisting of one thematic layer

4.1.2.g

Review the final vendor data format prior to Vector Product Format (VPF) conversion and record a final frequency count of all features for each thematic layer.













3.1.2

Ensure the digital marginalia [information that originally appeared in notes, tables, and graphs on the borders of the Operational Navigation Chart (ONC) map sheets (the source material)] is included in the area attribute values of the data quality coverage and in the data quality tables.


completeness

commission

the dataset













3.3

The unit of measure for the DCW database shall be the English measurement system.


logical consistency domain consistency


the dataset

4.1.2.g

A review of the final vendor data format prior to Vector Product Format (VPF) conversion. All attribute names and attribute definitions are verified.














3.2.1

The horizontal datum shall be the current World Geodetic System.

(identified data quality scope = the dataset)

logical consistency format consistency


1. the dataset

2.features encoded as points and polygons

3. all text strings


3.9

Where polygons on Operational Navigational Charts (source material) were below the minimum capturable size of less than or equal to 3,05 mm (0,12 in) in circumference, and consist of a single edge, they are represented as a point feature.

(identified data quality scope = encoded features)

4.1.2.d

A quality assurance check shall be used as a means for identifying and correcting problems with text placement. For example, a check shall be made to verify that text strings do not overlap.

(identified data quality scope = text strings)














tải về 354.17 Kb.

Chia sẻ với bạn bè của bạn:
1   2   3   4   5   6   7   8   9   10




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©tieuluan.info 2022
được sử dụng cho việc quản lý

    Quê hương