트위터 트윗을 포인트로 전환하시겠습니까?


R을 사용하여 트위터를 데이터마이닝하는 방법에 대해 조사해 왔지만 내 질문에 대한 답변이나 적절한 튜토리얼을 찾지 못했습니다.

특정 기간 내에 특정 해시태그가 포함된 트위터에서 트윗을 가져오고 QGIS 또는 ArcMap의 지도에 해당 트윗의 위치를 ​​표시하는 데 관심이 있습니다.

트윗에 지리적 위치가 연결될 수 있다는 것을 알고 있지만 처음에 이 정보를 어떻게 추출합니까?


순수한 Python을 사용하여 단어 필터를 사용하여 트윗의 좌표를 얻는 방법을 찾았습니다. 많은 사람들이 트윗에 위치를 포함하지 않는 것 같습니다.

이것은 라이브 스트리밍 데이터이기 때문에 원하는 것이 아닐 수도 있습니다. 고유한 필터 단어를 입력한 다음 Twitter 계정에서 해당 단어를 트윗하여 테스트할 수 있습니다. 트윗이 Python에 거의 즉시 표시되는 것을 볼 수 있습니다. 이것은 어떤 큰 행사에 사용하기에 꽤 멋질 것입니다.

Tweepy를 설치해야 합니다.

핍 설치 트위피

그리고 Twitter API 키를 받으세요.

그런 다음 이 스크립트를 템플릿으로 사용할 수 있습니다.

tweepy에서 json 가져오기 tweepy에서 스트림 가져오기 OAuthHandler에서 tweepy.streaming import StreamListener # Twitter API 키 정보 입력 consumer_key ="consumer_secret ="access_token ="access_secret ="file = open("C:Output.csv", "w ") file.write("X,Y
") data_list = [] count = 0 class listener(StreamListener): def on_data(self, data): global count #찾고 싶은 트윗 수, 시간에 따라 변경 가능 기반 if count <= 2000: json_data = json.loads(data) coords = json_data["coordinates"] if coords is not None: print coords["coordinates"] lon = coords["coordinates"][0] lat = coords ["좌표"][1] data_list.append(json_data) file.write(str(lon) + ",") file.write(str(lat) + "
") count += 1 반환 True else: 파일 .close() return False def on_error(self, status): print status auth = OAuthHandler(consumer_key, consumer_secret) auth.set_access_token(access_token, access_secret) twitterStream = Stream(auth, listener()) #여기에서 검색하려는 내용 twitterStream.filter(추적 k=["할로윈"])

Twitter에서 이 문서도 확인하십시오. 필터에 무엇을 넣을 수 있는지 보여줍니다.

필터를 몇 분 동안 "할로윈"으로 설정한 결과는 다음과 같습니다.

그리고 여기 할로윈을 언급한 첫 2000개의 트윗이 있습니다!

http://i.stack.imgur.com/bwdoP.png">

해피 할로윈!