기본 콘텐츠로 건너뛰기

1# (17.03.19 실패)파이썬(Python)을 활용해 사내식당 금일 메뉴 텔레그램 메세지로 전달받기

우리 사내식당 밥은 아주 맛있다.
맛이 없어서 그런건 아니고..

그냥 미리 어떤 음식이 나오는지 알고싶을 뿐이다.
맛없는게 나오면 안먹고 라면을 먹기 위해서 만드는 것은 아니다.

Brian Park 님의 블로그에서 초등학생 아들 알림장/급식메뉴를 텔레그램으로 알려주는 라즈베리파이 서버 관련 글을 읽고 처음으로 파이썬(웹프로그래밍 언어)에 도전하게 되었다.

의외로 스크립트언어? 사실 난 전문용어 잘 몰라유 ㅠㅠ 틀린게 있으면 바로잡아주세요 ㅠㅠ
처럼 순서대로 실행하고, C언어처럼 중괄호 개념이 아닌 들여쓰기로 구분..하는 것이 나에게는 심플하고 쉽게 느껴졌다.

물론 이런저런 명령어 외워야하는건 어쩔 수 없..ㅠ_ㅠ 

아무튼 나의 특기인 따라하기 신공을 통해
맥에 python 2.7을 설치하고, 적절한 편집기로 eclipse를 골랐다.
나처럼 일자무식자가 단순 연습을 하기 위해서는 eclipse보다 그냥 python 기본 제공 앱(?)인 IDLE을 활용하여 코드 한 줄 한 줄이 어떻게 실행되고 왜 실행이 안되는지 확인 할 수 있어서 더 좋은 것 같다.

어쨋든, 삼성웰스토리에 신규 가입을 해서 아이디와 비밀번호를 알아 둔 뒤..
urllib, urllib2, cookielib 라는 라이브러리를 임포트하여
내가 읽어올 페이지 특정 부분에서 내 아이디와 비밀번호 전송값을 대입하여 처리하는....
말해놓고 나니 무슨말인지...하아 
뭐 그런 방식인 것 같다.

urlencode가 핵심 키워드가 아닐까 싶다.
그래서~!

지금 아이디와 비번을 입력하여 접속된 화면이 출력되는 것 까지는 확인이 되었다.
이는, 아래에서 
f=opener.open('https://www.samsungwelstory.com/member/login.jsp')
for line in f:
print line.strip()
부분에서처럼 사이트를 열고, 한줄씩 열거하여 보여달라고 요청하여 나온 값들과
사파리에서 소스보기 값들과 대조를 통해 확인했다.

얼마전 TF를 통해 회사 홈페이지를 만들어서 html 언어와 php 언어에 대해서 공부 할 기회가 있어서 다행히 더 빠르게 소스를 이해할 수 있었다.


근데 막상 파이썬을 해보니,,, 영화속에서 해커들이 막 검정 화면에서 투닥탁탁 하는 그런 화면...! 을 내가 막 만지고 있었다.  뭔가 멋있음. 훗 


해커아재들의 멋진 모습

하지만..  정상적으로 로그인하여 오늘의 메뉴까지는 읽어 왔으나...
그다음이 문제군.. 이 페이지에서 어떻게 값을 줘서 내가 원하는 날짜의 값들을 원하는 형태로 받아 오지...!!? 더 연구 해 봐야겠다.


 위동영상은 로그인 및 오늘의메뉴까지 진입하는 명령어들을 연속적으로 실행하는 모습. 이걸 한줄씩하면 해커가 되는거임?
로그인한 뒤 오늘의 메뉴까지 진입하는 소스코드 (#과 같은 줄 내용은 주석임)

import urllib, urllib2, cookielib
# From here is what login to SamsungWelstory and Go to TodayMenu
username = '아이디'
password = '비밀번호!'

cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

login_data = urllib.urlencode({'memId' : username, 'pwd' : password})

opener.open('https://www.samsungwelstory.com/member/login.jsp', login_data)
#resp = opener.open('https://www.samsungwelstory.com/member/login.jsp')
f=opener.open('https://www.samsungwelstory.com/member/login.jsp')
for line in f:
    print line.strip()
#print resp.read()

print 'Now starting to connect TODAY MENU'

todaym=urllib.urlopen('http://www.samsungwelstory.com/customer/individual/todayMenu.jsp')
for line in todaym:
print line.strip()



3/19 추가...
너무 오랫동안 묵혀두는 프로젝트인 것 같아 다시 진행하려고 손을 데는 도중에..웰스토리에서 로그인 화면에 google recapcha를 도입이 되었음을 확인했다...
더이상 파이썬 봇으로 접근이 안된다.

기능을 추가한 소스를 공개한다.

#사람처럼 속이기 위해 requests 모듈을 import
#-*- coding: utf-8 -*-

import urllib, urllib2, cookielib, requests
from datetime import datetime
#날짜를 계산해서 원하는 날짜의 메뉴를 출력하도록 하기 위해 datetime도 import
from bs4 import BeautifulSoup
#출력된 값을 예쁘게 편집해서 텔레그램으로 보내기 위해서 BeautifulSoup모듈도 설치 및 import.

#사람처럼 속이는 requests 코드들.. 맥으로 접속하는 것처럼 속여보았다.
session = requests.Session()
headers = {"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_5) AppleWebKit 537.36 (KHTML, like Gecko) Chrome", "Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8"}
url = "https://www.samsungwelstory.com/member/login.jsp"
req = session.get(url, headers=headers)

bsObj = BeautifulSoup(req.text, "html.parser")
 
# 자 이제 여기서부터는 아이디와 비번을 쿠키에 넣고 로그인 하는 부분. 예전엔 잘 됐으나 지금은 구글 리캡챠에 걸려서 이 구간까지 진행이 안된다.
# From here is what login to SamsungWelstory and Go to TodayMenu
username = '아이디는 비밀'
password = '비밀번호라 비밀'

cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
urllib2.install_opener(opener) #추가함
#set form date
login_data = urllib.urlencode({'memId' : username, 'pwd' : password})

opener.open('https://www.samsungwelstory.com/member/login.jsp', login_data)
#resp = opener.open('https://www.samsungwelstory.com/member/login.jsp')
loginpage=opener.open('https://www.samsungwelstory.com/member/login.jsp')
for line in loginpage:
    print line.strip()
#print resp.read()

print 'Now starting to connect TODAY MENU'

#여기서부터는 오늘의 메뉴에 나올 날짜값을 조합하는 부분
zero = "0"
year = datetime.today().year
month = datetime.today().month
day = datetime.today().day
year_str = str(year)
#날짜를 숫자로 뽑고
month_str = str(month)
month_len = len(month_str)
month_len = 1
#문자로 변환한 뒤
if month_len:
    print("month_len's str number is 1, so add 0 in front of it")
    month_str =  zero + month_str
#2017-3-21 식으로 나오면 안되고 2017-03-21 식을 나와야 하기에 문자열 개수가 1이면 앞에 0을 추가하고 그렇지 않으면 그냥 두도록 if 문을 넣었다. 그리고 글자수가 하나라 앞에 0 추가했다는 메세지가 파이썬 쉘에 뜨도록 했다.

day_str = str(day)
dash = "-"
date = year_str + dash + month_str + dash + day_str
front = "&sDate="
mid = date
back = "&hall_no=E1C7"
#최종적으로 만들어진 문자열을 polarishallflag에 넣고
polarishallflag = front + mid + back
print "FOR DEBUG)))))) date setting is now : "+polarishallflag
#디버깅용으로 값을 한 번 확인해봤다.

#select_hall= urllib.urlencode({'modifyFlag' : polarishallflag})
#opener.open('http://www.samsungwelstory.com/customer/individual/todayMenu.jsp',select_hall)
#menupage=opener.open('http://www.samsungwelstory.com/customer/individual/todayMenu.jsp')
#for line in menupage:
# print line.strip()

soup = BeautifulSoup(urllib.urlopen('http://www.samsungwelstory.com/customer/individual/todayMenu.jsp').read())
editData = soup.find_all('ul', {'class': "list_food"})

print editData

#원하는 부분을 잘라서 출력되도록 한 뒤 텔레그램과 연계만 하면 되는데... 구글 리캡챠를 도입하다니 아쉽다. 누군가가 구글 리캡챠를 구글 음성API로 뚫었다고 하던데 그 방법도 곧 막힐테니.. 이쯤에서 이 프로젝트는 실패했다고 봐야하겠다. 그래도 파이썬 봇으로 로그인+자료 가공+출력까지의 방법을 알아냈다는 것이 작은 성과이고 다른 부분에서 연계하여 사용 할 부분이 있는지 알아 볼 예정이다.

댓글

댓글 쓰기

이 블로그의 인기 게시물

#1 (진행 중)아두이노 뇌파센서 헤드셋 만들기(Arduino EEG brain wave headset for psychological test) 만들어 뇌파 읽기

 15년 겨울쯤엔가 TED에서 흥미로운 동영상을 봤다. 뇌파를 통해 컴퓨터 안의 객체를 조종하는 모습을 시연하는 것이었다. 뇌파로 이런 것들이 가능하다는 것이 놀라웠다. 나는 심리학도가 아닌가. 뇌파가 더 정확한 심리검사를 만들 수 있는 도구가 될 수 있다는 생각이 들었다.  예를들어 검사문항(디지털 검사)이 100개짜리 라면 핵심 문항들(각 10번 단위)을 체크할 때마다 심경의 변화, 뇌파변화를 센서(객관적)도 기록하고 디지털검사(주관적)로도 기록해서 함께 데이터화 한다면 더 정확한 심경을 읽어 낼 수 있지 않을까? 라는 생각이었다. 2011년 대학원 다닐 때 컴공과 학부생들 겨울방학 특강으로 Objective-C를 무려1개월간 청강했고, C언어를 무려 2개월동안 학원에 다니면서 공부한 사람이기에 ! -_-;;;; 할 수 있을 것이다............  우선 뇌파센서를 구매해야겠지.  알리 익스프레스에서 구매한 EEG 뇌파센서 kit.  2개를 구매했다.비싸군 ㅠㅠ 배송이 한달정도 걸렸다. 학창시절 라디오 만들기인가..실과시간에 도전해본 납땜 이후로는 처음 해보는 납땜이어서 고생좀 했다. 뇌파를 측정해서 hex 코드로 컴퓨터로 읽어들일 수 있는 상태다. 읽어들인 hex값들을 10진수로 변환하고 유의미한 그래프로 그리거나 데이터화 하는 것이 필요 해 보이지만 아직 받은 값을 10진수로 변환하는 방법을 모르겠다. ㅠㅠ 소스코드는 그냥 단순히 hex값으로 읽어오는것이다보니.. 별거 없다;; 나중에 10진수로 변환하여 읽어들이고 자료화 하는 단계가 필요한 것 같은데 차근차근 진행 해 봐야겠다. 준비물 :  1. HM-08 블루투스 모듈 ($5.30) 2. 아두이노 나노 호환품 ($1.89) 3. direct nerosky e eg  brain sensor kit ($50.05) 4. 기타 빵판과

#1 (완료) 아두이노 음주 측정기(Alcohol tester with Arduino)

음주운전을 하지 않는 가장 좋은방법은 대리운전 비용 1만원~1.2만원이 아깝지 않으면서 대리운전 전화번호를 누를 수 있는 정도의 취함 상태인 것 같다. 그래서 생각해본 아이디어가 아예 법적으로 차량에 의무적으로 장치를 설치하도록 하는데 이 장치는 차에 시동을 걸기 전 음주측정을 해야하고 정상 수치내에 있을때만 시동이 걸리는 장치!  물론 조수석에 앉을 누군가가 음주운전을 돕기 위해 대신불어준다면 안되겠지만..ㅠㅠ 아침 출근을 위해 정말 급하게 가글을 하고 나와 출근하려 시동을 걸었는데..가글액에 섞인 알코올 성분때문에 지각을 하는 경우도 생길 수 있겠다만.. 그래도 한번 만들어 보자. 어차피 내게는 차량과 연동할 기술적 지식이 아직 없으므로! 하하하하 06.13 진행 중이나 아직 정리가 안됨 07.01 에 05.28 진행 내용 추가 실제 경찰들 처럼 더더더~ 멘트로 몰입감+정확성(3회 불어서 나온수치의 평균을 활용하는 벙법)을 높일 수 있도록 개선하였다. -_-; Ready 상태. 이후 3,2,1 카운트 후 blow! 그리고 수치를 반복하여 깜빡이며 한다. 이하 소스코드 #include <LiquidCrystal.h> // initialize the library with the numbers of the interface pins LiquidCrystal lcd(12, 11, 5, 4, 3, 2); void setup() {   // set up the LCD's number of columns and rows:   lcd.begin(16, 2); } void loop() { lcd.setCursor(1, 0); //라인1로 커서 위치   lcd.print("Ready...");   delay(4000); lcd.clear();   // set the cursor to column 0, line 1   // (note: line 1 is t

(완료) Cron의 crontab 명령으로 Python code를 스케쥴대로 실행하기(Run python code by fixed interval with using Cron)

(완료)1# Python 으로 지출관리 사이트에서 모든지출 데이터 xlsx 파일 뽑아내고 Zapier로 구글시트에 업데이트하기 (Using Python, crawling and exporting company wide expenses data with Xlsx file. Update a Google sheet from this Xlsx file with Zapier.) (완료) 2# Python 으로 지출관리 사이트에서 모든지출 데이터 xlsx 파일 뽑아내고 Zapier로 구글시트에 업데이트하기 (Using Python, crawling and exporting company wide expenses data with Xlsx file. Update a Google sheet from this Xlsx file with Zapier.) 위 포스팅 내용 대로, 1. python을 통해 selenium 모듈로 crawling을 해서 xlsx 파일을 이메일로 받고 2. xlsx 파일은 Zapier 라는 노코드 툴에서 Email parser by Zapier 와 2개의 Zap 으로 처리해서 구글시트에 업데이트를 했다. 하지만 계속 실시간 데이터를 유지하는게 필요하다.  그럼 이제  추가적으로 이제 이걸 딜레이 시간 을 포함해서 정기적으로 실행되도록 해보자. 딜레이가 Zapier에서 10분 나머지 작업이 진행되는데 2분 정도로 총 12분 걸리는 것으로 확인을 했다.  그리고 나의 경우엔 월요일부터 금요일까지, 아침 7시 30분 부터 저녁 6시 00분까지 30분 간격으로 업데이트 되도록 하겠다.   딜레이를 고려한다면 매 시 48,18분에 python 코드가 돌아가면 얼추 정각에 완료되는 거군! 그러기 위해서는 cron 이라는 리눅스 스케줄러를 사용하려고 한다. 1. terminal 을 열고 sudo apt install cron 으로 crontab을 설치 2. crontab -e 명령어로 VI편집기 오픈 3. i 를 눌러서 insert mode로 전환 4. 아래 명령어