온톨로지 과학자를 위한 지식그래프 (2021) - 김학래

온톨로지 과학자를 위한 지식그래프 (2021) - 김학래

2024-02-14 Bibliography bib knowledgegraph semanticweb c005

ontology:owl:rdf:

  • 실무자를 위한 그래프 데이터 활용법

  • Ivo Velitchkov (2023) Personal Knowledge Graphs #개인지식그래프

  • Barrasa Jesus (2023) Building Knowledge Graphs - 지식그래프

  • #지식그래프

  • #영문법: 문장 성분 품사 관계 + 지식 그래프

  • Semantic Web for the Working Ontologist: Effective Modeling for Linked Data, Rdfs, and Owl

  • 지능형 데이터의 출발점~이제 데이터는 고객, 기업, 정부를 분석하고 이해하는 핵심 자산이다. 전 세계가 상호 연결되고 글로벌화됨에 따라 데이터는 어떤 개인이나 조직의 소유가 아닌 방대한 데이터 웹의 일부가 되고 있으며, 데이터의 효과적 관리는 누구에게나 중요한 경쟁력이 되고 있다. 이 책은 대규모 데이터를 의미적으로 연결하고 기계가 읽고 처리할 수 있는 지능형 데이터의 출발점인 지식그래프를 설명한다.~~도서 특징~~~지식그래프 기술은 월드와이드웹 규모의 분산 데이터를 처리하고 공유하기 위한 철학을 가지고 있다. 시맨틱 웹과 링크드 데이터에서 발전한 지식그래프는 웹 표준과 연계되어 실용적 단계로 진화하고 있고 대규모 엔터프라이즈 데이터를 통합하기 위한 핵심 기술로 활용되고 있다. 구글, 마이크로소프트, 페이스북은 데이터를 지식그래프로 구축하고 자사의 데이터 서비스에 적용하고 있다. 이 책을 통해 시맨틱 웹과 지식그래프에 대한 이론을 이해하고 주요 기업의 실제 사례를 살펴볼 수 있다.

“지식그래프” 김학래 (2017)

(김학래 2017)

  • 인공지능에 대한 관심이 폭발적이다. 기계가 사람처럼 생각할 수 있을까? 인공지능은 어떻게 만들어질까? 사람의 지능을 인공적으로 만들고 기계가 처리하게 하려면 다양한 기술의 조합이 필요하다. 지식그래프는 인공지능을 만들기 위한 대표적 방법으로 지능형 서비스에 폭넓게 활용되고 있다. 이 책은 지식그래프의 개념과 관련 기술을 소개하고, 그 현재와 미래를 살펴본다.
  • Knowledge Graph

Notes

EKG page for tag: date/2024-01-20

지능형 데이터의 출발점

이제 데이터는 고객, 기업, 정부를 분석하고 이해하는 핵심 자산이다. 전 세계가 상호 연결되고 글로벌화됨에 따라 데이터는 어떤 개인이나 조직의 소유가 아닌 방대한 데이터 웹의 일부가 되고 있으며, 데이터의 효과적 관리는 누구에게나 중요한 경쟁력이 되고 있다. 이 책은 대규모 데이터를 의미적으로 연결하고 기계가 읽고 처리할 수 있는 지능형 데이터의 출발점인 지식그래프를 설명한다.

시맨틱 웹에 대한 이해를 다루면서 참고 서적을 기반으로 다룬다.

목차

Chapter 01 시맨틱 웹이란?

  • 1.1 웹이란?
  • 1.2 데이터로 소통하기(커뮤니케이션하기)
  • 1.3 분산 데이터
  • 1.4 이 장을 마치며

Chapter 02 시맨틱 모델링

  • 2.1 사람 간 커뮤니케이션을 위한 모델링
  • 2.2 설명과 예측
  • 2.3 가변성의 중재
  • 2.4 모델링의 표현력
  • 2.5 이 장을 마치며

Chapter 03 시맨틱 웹의 기초

  • 3.1 웹으로 데이터 분산하기
  • 3.2 여러 데이터 출처의 데이터 통합
  • 3.3 네임스페이스, URIs, 아이덴티티
  • 3.4 RDF 네임스페이스의 식별자
  • 3.5 도전과제: RDF 와 테이블
  • 3.6 고차 관계(High-Order Relationships)
  • 3.7 RDF 그래프 이름 지정
  • 3.8 직렬화의 대안
  • 3.9 공백 노드(Blank Nodes)
  • 3.10 이 장을 마치며

Chapter 04 시맨틱 웹 애플리케이션 아키텍처

  • 4.1 RDF 구문 분석기/직렬 변환기
  • 4.2 RDF 저장소
  • 4.3 애플리케이션 코드
  • 4.4 데이터 연합
  • 4.5 이 장을 마치며

Chapter 05 링크드 데이터

  • 5.1 데이터 웹 짜기
  • 5.2 HTTP 와 웹 아키텍처
  • 5.3 해시 또는 슬래시
  • 5.4 직접 확인해보기
  • 5.5 이 장을 마치며

Chapter 06 시맨틱 웹 질의하기: SPARQL

  • 6.1 Tell-and-Ask 시스템
  • 6.2 Tell-and-Ask 시스템으로서의 RDF
  • 6.3 SPARQL: RDF 용 질의 언어
  • 6.4 SPARQL 의 CONSTRUCT 질의
  • 6.5 CONSTRUCT 질의 결과 사용하기
  • 6.6 SPARQL 규칙: SPARQL 을 규칙 언어로 사용하기
  • 6.7 추이적 질의(SPARQL 1.1)
  • 6.8 SPARQL 의 고급 기능: 제한 및 주문
  • 6.9 이 장을 마치며

Chapter 07 RDF 확장: RDFS 와 SCHACL

  • 7.1 RDFS 를 사용한 RDF 의 추론
  • 7.2 Smarts 는 어디에?
  • 7.3 추론은 언제 발생하는가?
  • 7.4 RDF 에서의 기대
  • 7.5 이 장을 마치며

Chapter 08 RDF 와 스키마

  • 8.1 스키마 언어와 기능
  • 8.2 RDF 스키마 언어
  • 8.3 RDFS 모델링 조합과 패턴
  • 8.4 도전과제
  • 8.5 정의역과 공역을 사용한 모델링
  • 8.6 RDFS 의 비모델링 속성
  • 8.7 이 장을 마치며

Chapter 09 RDFS-Plus

  • 9.1 역(Inverse)
  • 9.2 종속성 네트워크 관리
  • 9.3 동등성
  • 9.4 다른 데이터베이스의 데이터 통합
  • 9.5 컴퓨팅 동일성: 기능적 속성
  • 9.6 몇 가지 추가 구성
  • 9.7 이 장을 마치며

Chapter 10 실무에서 RDFS-Plus 사용하기

  • 10.1 Schema.org
  • 10.2 열린 정부 데이터
  • 10.3 FOAF
  • 10.4 페이스북의 오픈 그래프 프로토콜
  • 10.5 이 장을 마치며

Chapter 11 SKOS-RDFS-Plus 로 어휘 관리하기

  • 11.1 단순 지식 조직 체계(SKOS)
  • 11.2 SKOS 의 의미 관계
  • 11.3 개념 체계
  • 11.4 SKOS 무결성
  • 11.5 SKOS 실행
  • 11.6 이 장을 마치며

Chapter 12 OWL 기초

  • 12.1 제약조건
  • 12.2 도전과제
  • 12.3 제약조건에 대한 대체 설명
  • 12.4 이 장을 마치며

Chapter 13 OWL 에서의 계산과 집합

  • 13.1 합집합과 교집합
  • 13.2 여러 개의 개체 구별하기
  • 13.3 출현 횟수
  • 13.4 여집합
  • 13.5 서로소 집합
  • 13.6 전제조건의 재검토
  • 13.7 모순(Contradictions)
  • 13.8 만족스럽지 못한 클래스
  • 13.9 클래스 관계의 추론
  • 13.10 개체와 클래스를 통한 추론
  • 13.11 이 장을 마치며

Chapter 14 웹이 있는 온톨로지: 모든 것을 하나로 통합하기

  • 14.1 온톨로지 아키텍처
  • 14.2 수량, 단위, 차원, 유형
  • 14.3 생물학적 온톨로지
  • 14.4 FIBO: 금융 산업 비즈니스 온톨로지
  • 14.5 이 장을 마치며

Chapter 15 좋은 모델링과 나쁜 모델링 사례

  • 15.1 시작하기
  • 15.2 좋은 이름 지정 관행
  • 15.3 일반적인 모델링 오류
  • 15.4 이 장을 마치며

Chapter 16 OWL 의 전문가 모델링

  • 16.1 OWL 부분집합과 모델링 철학
  • 16.2 OWL 2 모델링 기능
  • 16.3 이 장을 마치며

Chapter 17 결론과 향후 작업

참고문헌

찾아보기

What is the Semantic Web?

[2024-02-13 Tue 14:50]

1-4 장 정리

웹 데이터 소통 분산 데이터

What is a Web?

월드와이드웹과 의미론

온톨로지 과학자

W3C 권고안

기본 도구 -> 전문화된 도구

웹 이란

바네바 부시

Communicating with Data : 데이터 ‘소통’

사례 예시 모음

사례의 공통점 : 해당 데이터를 단순히 설명하여 공개하기 어렵다

왜? 특이하거나 상세해서 일일히 다 정리해 공개하려면 끝도 없다. 다만 그 데이터를 찾는 이들은 존재한다. 그들은 관련 지식도 가지고 있다. 그러니 데이터를 정형화된 룰로 정리하여 활용할 수 있게 한다.

소셜 데이터 : 통제의 균형이 필요하다

개인 데이터를 다 보내고 있다면? 당신의 투표 용지의 기호를 바꿀 수도 있다.

데이터를 어떻게 분산할 것인가? 데이터를 웹에 게시한다면 전 세계 데이터와 연결된다는 말이다.

데이터 과학 : 데이터에서 배운다 - 의미있는 데이터의 가용성

데이터 과학은 비지니스 수요 예측에 핵심이다. 의미 있는 데이터를 가지고 있는가가 중요하다. 곧 돈이기도 하다.

데이터가 배포되는 유일한 예는 의학 분야다. 여기서 성공한 예를 바탕으로 다른 분야에 적용하는 방법을 논한다.

Distributed Data : 기계 중심 연결 네트워크 데이터 공유

분산 데이터 : 공유/연결 된 데이터 네트워크, 정보 표현(인간) -> 데이터 교환 (기계)

  • 인간 중심의 정보 표현 => 기계 사이의 데이터 교환으로 변화
  • 데이터 출처 : 단일 지점 아니라, 상호 연결된 데이터 네트워크 활용
  • 여기에는 데이터 공유가 필요하다. 어떻게? 공유하는 것이 서로에게 이득이니까

distributed web of data 분산된 데이터 웹 - 결합 방법 -> RDF 모델 (3 장)

URL, URI 를 활용. 표현(representation) 수준이 아닌 데이터 수준의 분산 웹 구성 데이터를 의미 있는 방식으로 결합하는 방법 이해 : ‘진술문(statement)’ 데이터베이스를 그냥 올리는 것만으로는 불충분 -> 여러 이해 관계자 사이의 결합이 용이하도록 구성

진술문 statement : true/false or fact sentence (not opinion)
RDF Resource Description Framework

Features of a Semantic Web

AAA Slogan : Anyone can say Anyting about Any topic
Foundation of the design RDF : 결합 가능한 방식으로 데이터를 표현해야 함
no gatekeeper : distributed web of data is organic system : bottom-up grassroots phenomenon - data wilderness
  • 웹은 데이터의 광야이다. 게이트키퍼 또는 중앙 관리자는 없다. 분산 데이터 웹은 유기적인 시스템과도 같다
  • 그러기에 성장 할 수 있었다. 표현의 자유로써 상향식, 풀뿌리 현상을 이뤄내는 과정에서 말이다.
So I may speak 스스로 말하고 컨텐츠 확장 생태계

Summary

슬라이드 자료

지식 그래프 강좌?! 잠시만 그래프를 알려면 어떠한 백그라운드가 필요한가?

[슬라이드] 스터디 자료 (hike)

온톨로지 과학자를 위한 지식그래프

2022년 1월부터 연구실에서 스터디를 진행하고 있습니다. 스터디 기간은 약 2개월로 계획하고 있습니다. 스터디에 참여하는 구성원은 지식그래프와 관련된 대학원 수업을 수강한 경험이 있습니다. 매주 스터디가 완료되면, 슬라이드를 공유하겠습니다.

Chapter 1: 시맨틱 웹이란? (완료)Chapter 2: 시맨틱 모델링 (완료)Chapter 3: 시맨틱 웹의 기초 (완료)Chapter 4: 시맨틱 웹 애플리케이션 아키텍처 (완료)Chapter 5: 링크드 데이터 (완료)Chapter 6: 시맨틱 웹 질의하기: SPARQL (완료)Chapter 7: RDF 확장: RDFS와 SCHACL (완료)Chapter 8: RDF 스키마 (완료)Chapter 9: RDFS-Plus (완료)Chapter 10: 실무에서 RDFS-Plus 사용하기 (완료)Chapter 11: SKOS-RDFS-Plus로 어휘 관리하기 (완료)Chapter 12: OWL 기초 (완료)Chapter 13: OWL에서의 계산과 집합 (완료)Chapter 14: 웹에 있는 온톨로지: 모든 것을 하나로 통합하기 (완료)Chapter 15: 좋은 모델링과 나쁜 모델링 사례 (완료)Chapter 16: OWL의 전문가 모델링 (완료) • Chapter 17: 결론과 향후 작업 (완료)

참고자료

(Allemang, Hendler, and Gandon 2020)

links::KGC Book Club Knowledge Graphs Applied Session One - youtu.be

Related-Notes

References

김학래. 2017. 지식그래프. 커뮤니케이션북스. https://books.google.co.kr/books?id=docvDwAAQBAJ.
Allemang, Dean, Jim Hendler, and Fabien Gandon. 2020. Semantic Web for the Working Ontologist: Effective Modeling for Linked Data, Rdfs, and Owl. 3rd edition. New York: ACM Books.
마지막 수정일자