온톨로지 과학자를 위한 지식그래프 (2021) - 김학래
2024-02-14 Bibliography bib knowledgegraph semanticweb c005ontology:owl:rdf:
Semantic Web for the Working Ontologist: Effective Modeling for Linked Data, Rdfs, and Owl
지능형 데이터의 출발점~이제 데이터는 고객, 기업, 정부를 분석하고 이해하는 핵심 자산이다. 전 세계가 상호 연결되고 글로벌화됨에 따라 데이터는 어떤 개인이나 조직의 소유가 아닌 방대한 데이터 웹의 일부가 되고 있으며, 데이터의 효과적 관리는 누구에게나 중요한 경쟁력이 되고 있다. 이 책은 대규모 데이터를 의미적으로 연결하고 기계가 읽고 처리할 수 있는 지능형 데이터의 출발점인 지식그래프를 설명한다.~~도서 특징~~~지식그래프 기술은 월드와이드웹 규모의 분산 데이터를 처리하고 공유하기 위한 철학을 가지고 있다. 시맨틱 웹과 링크드 데이터에서 발전한 지식그래프는 웹 표준과 연계되어 실용적 단계로 진화하고 있고 대규모 엔터프라이즈 데이터를 통합하기 위한 핵심 기술로 활용되고 있다. 구글, 마이크로소프트, 페이스북은 데이터를 지식그래프로 구축하고 자사의 데이터 서비스에 적용하고 있다. 이 책을 통해 시맨틱 웹과 지식그래프에 대한 이론을 이해하고 주요 기업의 실제 사례를 살펴볼 수 있다.
“지식그래프” 김학래 (2017)
(김학래 2017)
- 인공지능에 대한 관심이 폭발적이다. 기계가 사람처럼 생각할 수 있을까? 인공지능은 어떻게 만들어질까? 사람의 지능을 인공적으로 만들고 기계가 처리하게 하려면 다양한 기술의 조합이 필요하다. 지식그래프는 인공지능을 만들기 위한 대표적 방법으로 지능형 서비스에 폭넓게 활용되고 있다. 이 책은 지식그래프의 개념과 관련 기술을 소개하고, 그 현재와 미래를 살펴본다.
- Knowledge Graph
Notes
EKG page for tag: date/2024-01-20
지능형 데이터의 출발점
이제 데이터는 고객, 기업, 정부를 분석하고 이해하는 핵심 자산이다. 전 세계가 상호 연결되고 글로벌화됨에 따라 데이터는 어떤 개인이나 조직의 소유가 아닌 방대한 데이터 웹의 일부가 되고 있으며, 데이터의 효과적 관리는 누구에게나 중요한 경쟁력이 되고 있다. 이 책은 대규모 데이터를 의미적으로 연결하고 기계가 읽고 처리할 수 있는 지능형 데이터의 출발점인 지식그래프를 설명한다.
시맨틱 웹에 대한 이해를 다루면서 참고 서적을 기반으로 다룬다.
목차
Chapter 01 시맨틱 웹이란?
- 1.1 웹이란?
- 1.2 데이터로 소통하기(커뮤니케이션하기)
- 1.3 분산 데이터
- 1.4 이 장을 마치며
Chapter 02 시맨틱 모델링
- 2.1 사람 간 커뮤니케이션을 위한 모델링
- 2.2 설명과 예측
- 2.3 가변성의 중재
- 2.4 모델링의 표현력
- 2.5 이 장을 마치며
Chapter 03 시맨틱 웹의 기초
- 3.1 웹으로 데이터 분산하기
- 3.2 여러 데이터 출처의 데이터 통합
- 3.3 네임스페이스, URIs, 아이덴티티
- 3.4 RDF 네임스페이스의 식별자
- 3.5 도전과제: RDF 와 테이블
- 3.6 고차 관계(High-Order Relationships)
- 3.7 RDF 그래프 이름 지정
- 3.8 직렬화의 대안
- 3.9 공백 노드(Blank Nodes)
- 3.10 이 장을 마치며
Chapter 04 시맨틱 웹 애플리케이션 아키텍처
- 4.1 RDF 구문 분석기/직렬 변환기
- 4.2 RDF 저장소
- 4.3 애플리케이션 코드
- 4.4 데이터 연합
- 4.5 이 장을 마치며
Chapter 05 링크드 데이터
- 5.1 데이터 웹 짜기
- 5.2 HTTP 와 웹 아키텍처
- 5.3 해시 또는 슬래시
- 5.4 직접 확인해보기
- 5.5 이 장을 마치며
Chapter 06 시맨틱 웹 질의하기: SPARQL
- 6.1 Tell-and-Ask 시스템
- 6.2 Tell-and-Ask 시스템으로서의 RDF
- 6.3 SPARQL: RDF 용 질의 언어
- 6.4 SPARQL 의 CONSTRUCT 질의
- 6.5 CONSTRUCT 질의 결과 사용하기
- 6.6 SPARQL 규칙: SPARQL 을 규칙 언어로 사용하기
- 6.7 추이적 질의(SPARQL 1.1)
- 6.8 SPARQL 의 고급 기능: 제한 및 주문
- 6.9 이 장을 마치며
Chapter 07 RDF 확장: RDFS 와 SCHACL
- 7.1 RDFS 를 사용한 RDF 의 추론
- 7.2 Smarts 는 어디에?
- 7.3 추론은 언제 발생하는가?
- 7.4 RDF 에서의 기대
- 7.5 이 장을 마치며
Chapter 08 RDF 와 스키마
- 8.1 스키마 언어와 기능
- 8.2 RDF 스키마 언어
- 8.3 RDFS 모델링 조합과 패턴
- 8.4 도전과제
- 8.5 정의역과 공역을 사용한 모델링
- 8.6 RDFS 의 비모델링 속성
- 8.7 이 장을 마치며
Chapter 09 RDFS-Plus
- 9.1 역(Inverse)
- 9.2 종속성 네트워크 관리
- 9.3 동등성
- 9.4 다른 데이터베이스의 데이터 통합
- 9.5 컴퓨팅 동일성: 기능적 속성
- 9.6 몇 가지 추가 구성
- 9.7 이 장을 마치며
Chapter 10 실무에서 RDFS-Plus 사용하기
- 10.1 Schema.org
- 10.2 열린 정부 데이터
- 10.3 FOAF
- 10.4 페이스북의 오픈 그래프 프로토콜
- 10.5 이 장을 마치며
Chapter 11 SKOS-RDFS-Plus 로 어휘 관리하기
- 11.1 단순 지식 조직 체계(SKOS)
- 11.2 SKOS 의 의미 관계
- 11.3 개념 체계
- 11.4 SKOS 무결성
- 11.5 SKOS 실행
- 11.6 이 장을 마치며
Chapter 12 OWL 기초
- 12.1 제약조건
- 12.2 도전과제
- 12.3 제약조건에 대한 대체 설명
- 12.4 이 장을 마치며
Chapter 13 OWL 에서의 계산과 집합
- 13.1 합집합과 교집합
- 13.2 여러 개의 개체 구별하기
- 13.3 출현 횟수
- 13.4 여집합
- 13.5 서로소 집합
- 13.6 전제조건의 재검토
- 13.7 모순(Contradictions)
- 13.8 만족스럽지 못한 클래스
- 13.9 클래스 관계의 추론
- 13.10 개체와 클래스를 통한 추론
- 13.11 이 장을 마치며
Chapter 14 웹이 있는 온톨로지: 모든 것을 하나로 통합하기
- 14.1 온톨로지 아키텍처
- 14.2 수량, 단위, 차원, 유형
- 14.3 생물학적 온톨로지
- 14.4 FIBO: 금융 산업 비즈니스 온톨로지
- 14.5 이 장을 마치며
Chapter 15 좋은 모델링과 나쁜 모델링 사례
- 15.1 시작하기
- 15.2 좋은 이름 지정 관행
- 15.3 일반적인 모델링 오류
- 15.4 이 장을 마치며
Chapter 16 OWL 의 전문가 모델링
- 16.1 OWL 부분집합과 모델링 철학
- 16.2 OWL 2 모델링 기능
- 16.3 이 장을 마치며
Chapter 17 결론과 향후 작업
참고문헌
찾아보기
What is the Semantic Web?
1-4 장 정리
웹 데이터 소통 분산 데이터
What is a Web?
월드와이드웹과 의미론
온톨로지 과학자
W3C 권고안
기본 도구 -> 전문화된 도구
웹 이란
바네바 부시
Communicating with Data : 데이터 ‘소통’
사례 예시 모음
사례의 공통점 : 해당 데이터를 단순히 설명하여 공개하기 어렵다
왜? 특이하거나 상세해서 일일히 다 정리해 공개하려면 끝도 없다. 다만 그 데이터를 찾는 이들은 존재한다. 그들은 관련 지식도 가지고 있다. 그러니 데이터를 정형화된 룰로 정리하여 활용할 수 있게 한다.
소셜 데이터 : 통제의 균형이 필요하다
개인 데이터를 다 보내고 있다면? 당신의 투표 용지의 기호를 바꿀 수도 있다.
데이터를 어떻게 분산할 것인가? 데이터를 웹에 게시한다면 전 세계 데이터와 연결된다는 말이다.
데이터 과학 : 데이터에서 배운다 - 의미있는 데이터의 가용성
데이터 과학은 비지니스 수요 예측에 핵심이다. 의미 있는 데이터를 가지고 있는가가 중요하다. 곧 돈이기도 하다.
데이터가 배포되는 유일한 예는 의학 분야다. 여기서 성공한 예를 바탕으로 다른 분야에 적용하는 방법을 논한다.
Distributed Data : 기계 중심 연결 네트워크 데이터 공유
분산 데이터 : 공유/연결 된 데이터 네트워크, 정보 표현(인간) -> 데이터 교환 (기계)
- 인간 중심의 정보 표현 => 기계 사이의 데이터 교환으로 변화
- 데이터 출처 : 단일 지점 아니라, 상호 연결된 데이터 네트워크 활용
- 여기에는 데이터 공유가 필요하다. 어떻게? 공유하는 것이 서로에게 이득이니까
distributed web of data 분산된 데이터 웹 - 결합 방법 -> RDF 모델 (3 장)
URL, URI 를 활용. 표현(representation) 수준이 아닌 데이터 수준의 분산 웹 구성 데이터를 의미 있는 방식으로 결합하는 방법 이해 : ‘진술문(statement)’ 데이터베이스를 그냥 올리는 것만으로는 불충분 -> 여러 이해 관계자 사이의 결합이 용이하도록 구성
진술문 statement : true/false or fact sentence (not opinion)
RDF Resource Description Framework
Features of a Semantic Web
AAA Slogan : Anyone can say Anyting about Any topic
Foundation of the design RDF : 결합 가능한 방식으로 데이터를 표현해야 함
no gatekeeper : distributed web of data is organic system : bottom-up grassroots phenomenon - data wilderness
- 웹은 데이터의 광야이다. 게이트키퍼 또는 중앙 관리자는 없다. 분산 데이터 웹은 유기적인 시스템과도 같다
- 그러기에 성장 할 수 있었다. 표현의 자유로써 상향식, 풀뿌리 현상을 이뤄내는 과정에서 말이다.
So I may speak 스스로 말하고 컨텐츠 확장 생태계
Summary
슬라이드 자료
지식 그래프 강좌?! 잠시만 그래프를 알려면 어떠한 백그라운드가 필요한가?
온톨로지 과학자를 위한 지식그래프
2022년 1월부터 연구실에서 스터디를 진행하고 있습니다. 스터디 기간은 약 2개월로 계획하고 있습니다. 스터디에 참여하는 구성원은 지식그래프와 관련된 대학원 수업을 수강한 경험이 있습니다. 매주 스터디가 완료되면, 슬라이드를 공유하겠습니다.
• Chapter 1: 시맨틱 웹이란? (완료) • Chapter 2: 시맨틱 모델링 (완료) • Chapter 3: 시맨틱 웹의 기초 (완료) • Chapter 4: 시맨틱 웹 애플리케이션 아키텍처 (완료) • Chapter 5: 링크드 데이터 (완료) • Chapter 6: 시맨틱 웹 질의하기: SPARQL (완료) • Chapter 7: RDF 확장: RDFS와 SCHACL (완료) • Chapter 8: RDF 스키마 (완료) • Chapter 9: RDFS-Plus (완료) • Chapter 10: 실무에서 RDFS-Plus 사용하기 (완료) • Chapter 11: SKOS-RDFS-Plus로 어휘 관리하기 (완료) • Chapter 12: OWL 기초 (완료) • Chapter 13: OWL에서의 계산과 집합 (완료) • Chapter 14: 웹에 있는 온톨로지: 모든 것을 하나로 통합하기 (완료) • Chapter 15: 좋은 모델링과 나쁜 모델링 사례 (완료) • Chapter 16: OWL의 전문가 모델링 (완료) • Chapter 17: 결론과 향후 작업 (완료)
참고자료
(Allemang, Hendler, and Gandon 2020)